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Resume 



La quantite de donnees de teledetection archivees est de plus en plus importante et grace aux 
nouveaux et futurs satellites, ces donnees offriront une plus grande diversite de caracteristiques 
: spectrale, temporelle, resolution spatiale et superficie de l’emprise du satellite. Les donnees 
de teledetection sont aujourd’hui abondantes et facilement accessibles, ce qui ouvre de 
nouvelles problematiques quant a la maniere d’utiliser ces donnees multidimensionnelles de 
maniere optimale. 

Cependant, il n’existe pas de methode universelle qui maximise la performance des traitements 
pour tous les types de caracteristiques citees precedemment; chaque methode ayant ses 
avantages et ses inconvenients. 

Les travaux de cette these se sont articules autour de deux grands axes que sont 1’ amelioration 
et l’automatisation de la classification d’images de teledetection, dans le but d’obtenir une carte 
d’occupation des sols la plus fiable possible. Lors d’un suivi de plusieurs annees, ce processus 
permet d’obtenir une carte des changements d’occupation des sols sur de grandes zones et de 
longues periodes. 

Au cours des differents chapitres du manuscrit, les methodes seront testees sur un panel de 
donnees tres variees de : 

- capteurs : optique (Formosat-2, Spot 2/4/5, Landsat 5/7, Worldview-2, Pleiades) et radar 
(Radarsat, Terrasar-X). 

- resolutions spatiales : de haute a tres haute resolution (de 30 metres a 0.5 metre). 

- repetitivites temporelles (jusqu’a 46 images par an). 

- zones d’etude : agricoles (Toulouse, Marne), montagneuses (Pyrenees), arides (Maroc, 
Algerie). 

Le manuscrit de these comprendra le developpement et 1’ application des idees suivantes : 

- un etat de Part sur les methodes de classification appliquees aux donnees de 
teledetection. 

revaluation et l’extraction d’indice de performance permettant de juger 
automatiquement des differentes caracteristiques d’une classification supervisee 
la selection automatique de donnees pour la classification supervisee 
la fusion automatique d’images issues de classifications supervisees afin de tirer 
avantage de la complementarite des donnees multi-sources et multi-temporelles 
la classification automatique basee sur des series temporelles et spectrales de reference, 
ce qui permettra la classification de larges zones sans reference spatiale 

A l’exception des applications directes de chaque chapitre, deux applications majeures seront 
detaillees : 

l’obtention d’un bilan carbone a partir des rotations culturales obtenues sur plusieurs 
annees 

la cartographic de la trame verte (espaces ecologiques): etude de l’impact du choix du 
capteur sur la detection de ces elements 
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Abstract 



As acquisition technology progresses, remote sensing data contains an ever increasing amount 
of information. Future projects in remote sensing like Copernicus will give a high temporal 
repeatability of acquisitions and will cover large geographical areas. As part of the Copernicus 
project, Sentinel-2 (European project satellite from ESA) will carry an optical payload with 
visible, near infrared and shortwave infrared sensors comprising 13 spectral bands: 4 bands at 
10 m, 6 bands at 20 m and 3 bands at 60 m spatial resolution (the last one is dedicated to 
atmospheric corrections and cloud screening), with a swath width of 290 km. Sentinel-2 
combines a large swath, frequent revisit (5 days), and systematic acquisition of all land surfaces 
at high- spatial resolution and with a large number of spectral bands. All of these characteristics 
make a unique mission to serve Global Monitoring for Environment and Security. 

The context of my research activities has involved the automation and improvement of 
classification processes for land use and land cover mapping in application with new satellite 
characteristics. This research has been focused on four main axes: 

Selection of the input data for the classification processes 

- Improvement of classification systems with introduction of ancillary data 

- Fusion of multi-sensors, multi-temporal and multi-spectral classification image results. 
Classification without ground truth data 

These new methodologies have been validated on a wide range of images available: 

- Various sensors (optical: Landsat 5/7, Worldview-2, Formosat-2, Spot 2/4/5, Pleiades; 
and radar: Radarsat, Terrasar-X) 

Various spatial resolutions (30 meters to 0.5 meters) 

Various time repeatability (up to 46 images per year) 

Various geographical areas (agricultural area in Toulouse, France, Pyrenean mountains 
and arid areas in Morocco and Algeria). 

These methodologies are applicable to a wide range of thematic applications like Land Cover 
mapping, carbon flux estimation and greenbelt mapping. 
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1 : La teledetection d’hier a demain 



Introduction generate 

1 . La teledetection d’hier a demain 

La teledetection est l’ensemble des techniques qui permettent d’obtenir de l’information sur la 
surface de la Terre sans contact direct avec celle-ci (y compris l’atmosphere et les oceans) 
notamment par l’acquisition d’images. La teledetection englobe tous les processus qui 
consistent a capter et enregistrer l’energie d’un rayonnement electromagnetique emis ou 
reflechi, a traiter et analyser l’information qu’il represente, pour ensuite mettre en application 
cette information. 

La teledetection commenqa en 1856 lorsqu’un appareil photographique fut installe de fagon 
fixe a bord d'un ballon. La photographie aerienne verticale fut ensuite largement utilisee pour 
la cartographie, notamment lors de la premiere guerre mondiale. Pendant l’entre-deux guerres, 
la photographie aerienne devient un outil operationnel pour la cartographie, la recherche 
petroliere et la surveillance de la vegetation. La periode de 1957 a 1972 marque les debuts de 
l’exploration de l’Espace et prepare l'avenement de la teledetection actuelle. Le lancement des 
premiers satellites, puis de vaisseaux spatiaux habites a bord desquels sont embarques des 
cameras, revele l’interet de la teledetection depuis l'espace. La premiere application 
operationnelle de la teledetection spatiale apparait dans les annees 1960 avec les satellites 
meteorologiques de la serie ESSA. 

Le lancement en 1972 du satellite Landsat-1, premier satellite de teledetection des ressources 
terrestres, ouvre l’epoque de la teledetection modeme. Le developpement constant des capteurs 
et des methodes de traitement des donnees numeriques ouvre de plus en plus le champ des 
applications de la teledetection et en fait un instrument indispensable de gestion de la planete 
et un outil economique. En 1986, le premier satellite de la famille Spot est lance et ouvre l’aire 
de la diffusion et de la commercialisation des images de teledetection. 

Dans le domaine du rayonnement visible et infrarouge, les capteurs a tres haute resolution 
spectrale sont d’utilisation courante. Les satellites sont de plus en plus petits et permettent des 
applications ciblees. Les satellites a capteur radar, actif ou non, se generalise pour une 
utilisation civile (SMOS, Terrasar, Sentinel- 1, etc.). La diffusion acceleree et 1’ augmentation 
de la puissance des ordinateurs contribuent a promouvoir de nouvelles methodes d’utilisation 
des donnees toujours plus abondantes fournies par la teledetection spatiale. 

Demain, la diversite des satellites d’observation va s’accroitre. L’apparition de constellation de 
satellites permettra Tacquisition reguliere d’une meme scene, a differentes resolutions et dans 
diverses longueurs d’ondes. 

Ces futures constellations telle que Sentinel (Copernicus, ex-GMES, lancement prevu en 2014 
par ESA) mettront gratuitement et rapidement leurs donnees a disposition apres les dates 
d’observation. La democratisation de la teledetection et de l’imagerie satellite entrainera la 
necessite de mise a disposition d’outils intuitifs et automatique pour le grand public. 
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Introduction generale 



2. L’utilisation de donnees multidimensionnelles de teledetection pour la 
cartographie des sols : enjeux et problematiques 

Aujourd’hui, la quantite d’images de teledetection est abondante, variee et accessible. Divers 
problemes se posent pour l’utilisation de ces donnees, notamment pour la cartographie de 
l’occupation des terres. Parmi ces problemes, nous citerons les suivants : 

Quelles sont les meilleures images a utiliser pour une application thematique ? 
Comment peut-on utiliser la diversite des informations pour ameliorer les performances 
des systemes de classification ? 

Quelles sont les limites intrinseques d’une methode automatique en fonction des 
donnees utilisees ? Peut-on se liberer de ces limites ? Si oui comment ? 

Cette these se proposera de donner une reponse a ces questions en presentant une approche 
originale, permettant le traitement automatique et optimal des images, afin d’obtenir une carte 
d’occupation des sols. 

Cependant, il n’existe pas de methode universelle qui maximise la qualite des traitements pour 
tous les types de caracteristiques. Chaque methode a ses avantages et ses inconvenients. Le but 
de cette these ne sera done pas de mettre en avant une methode plutot qu’une autre, mais de 
montrer et de valider une methodologie permettant d’utiliser la diversite des donnees afin de 
fournir une approche la plus robuste, performante et automatique. 

3. L’approche proposee et l’organisation du manuscrit 

Ce manuscrit est compose de sept chapitres. Le premier chapitre presentera un etat de Part des 
methodes de classification d’images, applicables a la teledetection. L’accent sera mis sur les 
particularity de ces methodes : supervisees ou non supervisees (avec ou sans verite terrain), 
parametriques ou non parametriques, ponctuelles, objet ou globales. 

Au chapitre 2, dans le but de caracteriser les methodes et les donnees utilisees pour la 
classification, j’introduirai de nouveaux indices de performance afin d’evaluer les resultats de 
classifications supervisees. Un point sera egalement fait sur 1’ interpretation des classifications 
non supervisees, et justifiera l’introduction au chapitre 5 d’une nouvelle methode de 
classification sans verite terrain de la zone a etudier. 

Aux chapitres 3 et 4, j’introduirai une methodologie alliant automatisation et amelioration des 
classifications, appelee Selection-Classification-Fusion (figure 0.1). 

La premiere partie de cette methode presentee dans le chapitre 3 consistera a introduire un 
algorithme de selection robuste et flexible, afin de selectionner les meilleurs jeux de donnees 
d’ entree du processus de classification, en fonction de criteres de recherche precis introduits au 
chapitre 2. Cette selection pourra se faire d’un point de vue temporel, spectral mais egalement 
sur le choix du classifieur ou de toute autre caracteristique pouvant avoir une influence sur le 
processus de classification. 
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3 : L’approche proposee et 1’ organisation du manuscrit 
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figure 0.1 : Illustration de P organisation de la methodologie presentee 



La seconde partie de la methode (chapitre 4) consistera a ameliorer le resultat final par fusion 
de resultats de classification en utilisant la complementarite de plusieurs resultats obtenus dans 
des conditions differentes (temporelles, sources, classifieur). Cette methode a l’avantage de 
pouvoir fusionner automatiquement n’importe quel resultat de classification sans hypothese 
particuliere sur les donnees. Plusieurs applications de fusion de resultats de classification seront 
presentees (optique/radar, multi-classifieur,...). 

Au chapitre 5, une methode de classification guidee par une collection de donnees statistiques 
de valeurs radiometriques sera proposee. Cette methode automatique permet d’obtenir une 
occupation du sol sans verite terrain de la zone a etudier. 

Les methodes de ces 5 premiers chapitres seront validees sur de multiples jeux de donnees : 
optique (Formosat-2, Spot 2/4/5, Landsat 5/7, Worldview-2, Pleiades) et radar (Radarsat, ERS, 
Terrasar-X), resolutions spatiales variees de haute a tres haute resolution (de 30 metres a 0.5 
metre), repetitivites temporelles variees (jusqu’a 46 images par an) et sur des zones d’etude 
differentes (agricoles (Toulouse, Marne), montagneuses (Pyrenees), arides (Maroc, Algerie)). 

Les resultats des methodes presentees seront utilises pour deux projets majeurs : la detection 
des changements et V estimation des flux de carbone (chapitre 6) et la cartographic des trames 
vertes et bleues (chapitre 7). La detection des changements et Testimation des flux de carbone 
font partie du programme Copernicus de l’ESA et necessite la creation d’une carte de rotation 
des occupations du sol. Les outils developpes ont egalement servi a la cartographie des trames 
vertes (engagement national pour l’environnement, loi Grenelle 2 de l’environnement). Cette 
application fait notamment partie du projet Copernicus mais a une echelle europeenne. 
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Chapitre I. La classification 



Resume : En teledetection, le probleme de la classification multidimensionnelle est 

complexe et depend de nombreux parametres. II n’existe pas une mais plusieurs 
fagons de classer les pixels d’une image et chacune est a utiliser dans des 
contextes differents, d’ou la necessite pour la comprehension des chapitres 
suivants de la presentation detaillee de ces methodes de classification qui 
peuvent etre supervisees ou non supervisees (avec ou sans verite terrain), 
parametriques ou non parametriques, ponctuelles, objet ou globales. Ces 
methodes sont ensuite appliquees et comparees sur un exemple concret d’images 
de teledetection. 

Mots cles : classification multidimensionnelle, surface de decision, ICM, donnees exogenes 



« Si les nuances infinies du langage ne s'accommodent point 
des classifications rigides qu'on veut faire, tant pis pour les 
classifications. La science doit s'accommoder a la nature. La 
nature ne peut s'accommoder a la science. » 

Ferdinand Brunot, 1922 



5 



te I- 0 0 9 2 1 8 5 3 , v e r s io n 



Chapitre I : La classification 
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1 : Introduction 



1. Introduction 

1.1. Definitions et existence 

« La classification proprement dite est une operation de l'esprit qui, pour la commodite des 
recherches ou de la nomenclature, pour le secours de la memoire, pour les besoins de 
l'enseignement, ou dans tout autre but relatif a l’homme, groupe artificiellement des objets 
auxquels il trouve quelques caracteres communs, et donne au groupe artificiel ainsi forme une 
etiquette ou un nom generique. » Telle est la definition de Cournot (Cournot, 1851) concernant 
la classification d’un point de vue general. 

II y a deux points de vue philosophiques qui permettent de separer la classification en deux 
categories (Russel & Whitehead, 1925) : 

- La demarche platonicienne qui suppose la preexistence des categories a observer sur 
l’observateur, ici Thumain. L’humain ne fait done que decouvrir, plus ou moins 
imparfaitement, le monde qui Tentoure. Cette maniere de voir le monde est aussi 
appelee « realisme » et n’est plus majoritaire depuis le Moyen-age. 

- Le nominalisme qui suppose que l’humain donne une semantique de la scene en 
fonction de son observation. Cette observation conduit done au classement. L’humain 
fait ainsi parti du probleme de classification et le processus de classification sera correle 
au facteur humain. 

II y a egalement deux points de vue mathematiques : 

La classification supervisee qui utilise la connaissance de la zone a etudier (verites 
terrain) pour decider des categories a attribuer. 

- La classification non supervisee qui ne presuppose aucune connaissance de la zone a 
etudier, done sans verite terrain. 

La classification non supervisee decoule naturellement du realisme et la classification 
supervisee du nominalisme. 

Dans le cadre de la classification supervisee, la significativite et la representativite des 
echantillons sont alors primordiales, le processus de classification ne foumissant qu’une 
fonction discriminante initialisee a partir de cette reference. Certaines methodes se reveleront 
ainsi plus robustes que d’autres aux erreurs contenues dans les echantillons de references, la 
fiabilite des verites terrain n’etant pas absolue. 

Dans le cadre de la classification non supervisee, un compromis sur le degre de representation 
de la scene doit etre pris en compte. Ce compromis se fait dans le choix du nombre de classes 
et de la quantite de pixels a explorer pour initialiser le processus. Mis a part cette etape de 
decouverte, le principe des methodes de classification non supervisee reste identique a celui des 
methodes de classification supervisee. 

Commengons par definir quelques termes de classification qui nous serviront dans la suite du 
manuscrit. 
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Chapitre I : La classification 



Definition : Nous appellerons classifieur toute fonction ou ensemble de regies de decision 
permettant de transformer un ensemble de donnees appartenant a R n en un ensemble de classes 
discretes appartenant a N. 

Nous ne definirons pas le terme classe au sens mathematique du terme mais de la fagon 
suivante : 

Definition : Une classe est definie par un ensemble d’ elements la composant dont les 
caracteristiques ont ete jugees similaires (humainement ou mathematiquement). Les elements 
composant une classe peuvent ainsi etre les pixels d’une image ou des ensembles de pixels alors 
appeles objets. 

1.2. La classification appliquee a la teledetection pour la cartographie de l’occupation 
des sols 

En teledetection, la classification consiste a effectuer la correspondance entre les elements 
d’une scene de l’image materialises par des pixels, representes par des valeurs radiometriques 
multidimensionnelles, et un ensemble de classes thematiques connues a priori ou non. Cette 
correspondance est realisee par des fonctions discriminantes sous forme de regies de decision, 
qui sont definies et apprises a partir des informations a priori. En resume, la classification vise 
a attribuer aux pixels des etiquettes dont l’origine est thematique (Ducrot, 2005). Les jeux 
d’images de teledetection peuvent etre composes d’images acquises a plusieurs dates 
(dimension temporelle) et suivant differentes longueurs d’ondes (dimension spectrale). 

1.3. Les categories de methodes de classification 

Dans le paragraphe 1.1, nous avons aborde une premiere partition concernant le type de 
classification : supervisee et non supervisee. 

Un deuxieme partitionnement concerne la modelisation de la fonction discriminante. Si cette 
fonction suit une distribution statistique connue, on parle de methode de classification 
parametrique. Cette association offre la possibility d’affecter a chaque site (ou pixel) une 
probability d’appartenance a une classe donnee. Tout classifieur probabiliste est done 
parametrique. Dans le cas contraire, on parle de methode de classification non parametrique, 
car aucune distribution n’est utilisee pour modeliser les donnees et seule la relation entre 
individus est consideree. Cette categorie comprend notamment les methodes basees sur le 
seuillage, la minimisation de distance et les methodes a noyau. 

Un troisieme partitionnement concerne le mode operatoire de la methode de classification. II 
existe trois modes operatoires : ponctuel, objet et global. La methode ponctuelle suppose 
Tindependance des pixels de l’image et les traite independamment les uns des autres. La 
methode objet suppose Tindependance des objets dans l’image mais la dependance des 
elements d’un meme objet. La methode globale suppose la dependance de tout element de 
l’image avec Tensemble de ses voisins. Comme nous le verrons plus tard, cette dependance se 
limite a un nombre restreint de voisins lorsque la methode est sous hypotheses markoviennes. 
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1 : Introduction 



notation 


definition 


IM 


un ensemble d’images 


IM dk 


l’image de la date d au canal k 


s 


un site (ou pixel) 


s ijdk 


le pixel s de coordonnees (i, j, d, k) 


X s 


la valeur observee au pixel s 


IM S 


un site s de l'image 


D 


un ensemble de dates 


d 


une date d’ acquisition de l’image 


K 


un ensemble de canaux spectraux 


k 


un canal spectral d’acquisition de l’image 


zone 


un ensemble de pixels a etudier 


C 


un ensemble de classes (ou etiquettes) 


c s 


la classe attribute au pixel s 


V 


un systeme de voisinage 


V s 


un point s du voisinage V 


u 


une fonction energie 


tic 


le vecteur des moyennes de la classe c 


°c 


le vecteur des ecarts types de la classe c 


Sc 


la matrice des covariances de la classe c 


s 


un ensemble de sites 


M 


l’ensemble des matrices de confusions 


m c c 


la confusion de la matrice m pour les points classes en tant 
que Cj mais appartenant a la classe q dans l’image de 
validation 


CLA 


l’ensemble des images des resultats de classification 


#E 


le cardinal ou nombre d’ element d’un ensemble fini E 



tableau 1.1 : Termes et definitions 
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Chapitre I : La classification 



2. Les methodes de classification multidimensionnelles applicables a la 
teledetection 

Dans la suite de ce chapitre, je presenterai les differentes methodes de classification appartenant 
aux trois partitions detaillees precedemment. Chaque methode sera accompagnee d’ illustrations 
de son fonctionnement. 

Commengons par introduire les notations qui seront utilisees au cours des differents chapitres 
et regroupees au tableau 1.1. Dans le cadre de la classification d’images de teledetection 
multidimensionnelles, nous noterons IM l’ensemble des images disponibles a classer et Sjj dk 
les elements ou pixels appartenant a IM avec (i, j, d, k) les coordonnees du point s dans 
l’univers IM (i pour la ligne, j pour la colonne, d pour la date et k pour la bande spectrale ; voir 
la figure 1.1 pour une illustration de cette representation en quatre dimensions). La valeur 
observee au pixel s est notee x s . 




di d 2 



figure 1. 1 : Position du pixel s suivant les 4 dimensions utilisees en teledetection: i pour la ligne, j pour la 
colonne, d pour la date et k pour la bande spectrale) 

Chaque element thematique de reference est appele classe et note c. Pour chaque classe c, on 
peut calculer la moyenne, 1’ecart-type et la covariance des pixels pour chaque date d et bande 
spectrale k a partir des donnees de references (ou apprentissage). Ces statistiques sont notees 
respectivement | 4 . c , ct c et I c . 

Dans un but d’ illustration des methodes de classification presentees dans ce chapitre, nous 
prendrons un exemple volontairement simpliste d’une image RVB (Rouge-Vert-Bleu). Seules 
les bandes spectrales rouge et verte seront utilisees pour la classification, ce qui facilitera la 
visualisation des nuages de points et des surfaces de decisions (figure 1.2). Des echantillons de 
3 classes ont ete acquis pour l’apprentissage et la verification (figure 1.3). L’image represente 
une fleur rouge disposant d’un pistil jaune avec un arriere-plan vert. Le nuage de point et les 
references choisies sont presentes en figure 1.4. Cet exemple permettra de visualiser et de 
comprendre les mecanismes des differentes methodes de classifications. 
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2 : Les methodes de classification multidimensionnelles applicables a la teledetection 



2.1. Les methodes de classification ponctuelle 




figure 1.2 : Image utilisee pour 1’ illustration des 
methodes de classification. Seules les bandes Rouge 
et Verte seront utilisees pour la classification 



figure 1.3 : Echantillons d’apprentissage pour les 
classifications supervisees : en Rouge les petales de 
la fleur, en Jaune le pistil et en Vert la vegetation en 
arriere-plan 




figure 1.4 : Nuage de points associe a la figure 1.2 et aux echantillons de la figure 1.3. Le centre des classes est 

indique par un point bleu 




figure 1.5 : Surface de decision de la methode figure 1.6 : Image resultant de la classification de la 
de classification par seuillage : parallelepipede. figure 1.2 par la methode du parallelepipede (a=3) 
La superposition du rectangle rouge et du jaune 
rend la decision impossible. 

2.1.1. La methode de classification par seuillage 
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Chapitre I : La classification 



La premiere fagon de classer un individu dans une partition est issue de la logique booleenne. 
Cette methode assez simple consiste a verifier la presence ou non de 1’ individu dans une 
partition afin de decider de son appartenance. Cette methode est non parametrique. 

En pratique, on choisira de classer un individu en fonction d’un seuil definissant les differentes 
partitions C de l’univers IM. La methode la plus utilisee pour ce seuillage s’appelle la methode 
de classification du « parallelepipede ». 

Un ensemble de parametres de regularisation note a permet de regler l’etendue (l’aire) du 
parallelepipede. La regie de decision permettant de determiner la classe optimale c° pt pour 
chaque pixel s de 1’ image est la suivante : 

c° pt = c si et seulement si x s 6 [p. cdk — a d,k * a c,d,k > hc,d,k + a d,k * a c,d,k]< Vd G D, k G K 

Cette regie de decision forme un parallelepipede multidimensionnel de centre p cdk et de largeur 
2 * a d; k * o c ,d,k (figure 1.5, page precedente). Le principal inconvenient de cette methode est 
son incapacity a decider lors de la superposition de plusieurs surfaces de decision (exemple de 
la figure 1.6 avec la superposition de la surface rouge et jaune). De ce fait, cette methode genere 
en general beaucoup de pixels non-classes c'est-a-dire dont la decision n’a pu etre prise. 

2. 1 .2. Les methodes de classification par minimisation de distance 

Une seconde fagon de classer un individu consiste a caracteriser les interactions et relations de 
1’ individu avec les partitions de maniere « reelle », et non plus booleenne. En choisissant un 
certain type de relation ou d’affinite, il sera facile de quantifier la proximite d’un element a une 
partition. 

Une des manieres de caracteriser cette interaction est d’utiliser la notion de distance qui permet 
de mesurer precisement la longueur entre deux elements (et par extension entre un element et 
une partition ou encore entre deux partitions). 

Commengons par definir la notion de distance entre deux points. 

Definition : Dans un espace vectoriel norme (E, ||. ||), on definit une distance d a partir de la 
norme ||. || entre deux points x et y tel que V (x, y) G E x E : d(x,y) = ||y — x||, d : ExE — > 
M + et qui verifie les proprietes suivantes : 

i. Vx,y G E : d(x,y) = d(y,x) (propriety de symetrie) 

ii. V x, y G E : d(x,y) = 0 x = y (propriety de separation) 

iii. V x, y, z G E : d(x, z) < d(x,y) + d(y, z) (propriety de l’inegalite triangulaire) 

L’ espace E ainsi muni d’une distance d est appele espace metrique. 

En particular dans R n , la distance entre deux points s’ecrit generalement a l’aide de la 
formulation de Minkowski, que l’on appelle p-distance (equation 1.1). 

V (x,y) GR n x R n , d p (x,y) = 



1 1 x y Hr 



2 |xi — yi|i 



( 1 . 1 ) 



i=l..n 
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2 : Les methodes de classification multidimensionnelles applicables a la teledetection 



Les trois formulations derivees de la p-distance les plus utilisees sont : 
- la 1 -distance ou distance de Manhattan : 



V ( x , y) £ l n x R n , d x 




( 1 . 2 ) 



- la 2-distance ou distance euclidienne : 



n 



V (x,y) £i”x R n ,d 2 (x, y) = 




(1.3) 



- la co-distance ou distance de Tchebychev : 

V (x,y) £l n x R n , doo (x, y) = sup |Xi - yj| q 4 \ 

1 <i<n 

Rappelons pour information qu’il y a equivalence des normes et done des distances dans R n . 

On definit ensuite les distances d’ordre 2 en ajoutant des statistiques d’ordre 2 (ecart-type et 
covariance) dont la plus utilisee pour mesurer la distance entre un point et un ensemble est la 
distance de Mahalanobis definie par l’equation 1.5: 

V x 6 R n , c 6 C, d maha (x, c) = V(x- Pc) 7 ^ 1 ^- He) ( L5 ) 



Aftn de comparer deux ensembles, il convient d’utiliser la distance de Bhattacharyya 
(Bhattacharyya, 1943) ou la divergence de Kullbach-Leibler (respectivement les equations 1.6 
et 1.7). Nous presentons une version amelioree de la divergence de Kullbach-Leibler qui ajoute 
la propriete de symetrie a la divergence originale de (Kullback & Leibler, 1951). Neanmoins, 
nous prefererons la distance de Bhattacharyya pour la comparaison de deux ensembles du fait 
du manque de la propriete de l’inegalite triangulaire pour la divergence de Kullbach-Leibler. 



V (c 1( c 2 ) G C x C, d bhatta (c 1; c 2 ) = - (p Cl 







( 1 . 6 ) 



V(c lf c 2 )eCxC, 



di^kl,sym(^l' ^2) 



= i(tr(E Cl 5: c - 2 1 ) + tr(E C2 2: c - 1 1 ) 

+ (bci — 4 c 2 ) (Sc, 1 + Sc^CUd 



HcJ) 



(1.7) 



Les distances d’ordre superieur ou egal a 3 ne sont pas utilisees du fait de leur complexite de 
calcul, notamment pour l’inversion de matrices de dimension 3 et plus. 
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Chapitre I : La classification 



Introduisons maintenant ces mesures entre les pixels a classer et les pixels de reference aux 
algorithmes de classification. 

L’algorithme de classification par minimisation de distance (ou encore K-plus-proches-voisins) 
introduit par Cover (Cover & Hart, 1967) est tres utilise en teledetection (Lee, Weger, Sengupta, 
& Welch, 1990). Cet algorithme attribue au pixel s la classe la plus proche c° pt (equation 1.8). 

c ° Pt = arg min d(x s ,c s ) (1.8) 

C s tL 

Avec d(x s , c s ) une distance entre le pixel s et la classe c s . 

La classe c s peut alors etre restreinte a sa moyenne q c pour les distances d’ordre 1 ou a sa 
moyenne p c et sa matrice de covariance £ c pour les distances d’ordre 2. 

Voyons au travers de l’exemple introduit en debut de chapitre 1’ illustration des differences entre 
les distances introduites precedemment. 

Dans le cas des 3 distances d’ordre 1, les frontieres de decision de l’algorithme de classification 
sont definies par des polygones de Voronoi (Voronoi, 1908). Les surfaces de decision sont 
illustrees pour chacune des distances presentees precedemment : la distance d-1 (Manhattan, 
figure 1.7), la distance d-2 (euclidienne, figure 1.9) et la distance d-oo (Tchebychev, figure 1.1 1). 
Les classifications associees sont presentees aux figures 1.8, 1.10 et 1.12. 

Pour les distances d’ordre 2, la surface de decision d’un classifieur utilisant la distance de 
Mahalanobis forme des hyperboloides (figure 1.13) dont le centre est la moyenne de la classe 
et les rayons definis par les valeurs propres de la matrice de covariance (explication en figure 
1.15). Le resultat de la classification par minimisation de distance de Mahalanobis est presente 
en figure 1.14. L’apport de cette nouvelle distance est visible, les confusions jaune/rouge et 
vert/rouge sont tres nettement diminuees. 

La minimisation de distance conduit a des decisions incorrectes lorsque les dispersions des 
classes sont tres differentes entre elles, id est des determinants de matrice de covariance 
differents et done des volumes d’hyperboloi'des differents. La figure 1.16 illustre ce phenomene. 
Bien que la distance euclidienne de s a c x soit plus petite que celle de s a c 2 , le point s est plus 
proche du nuage de point de c 2 , d’ou l’interet de la distance de Mahalanobis. 

Rien ne justifie alors l’utilisation de la meme metrique pour les differentes classes (Saporta, 
2006), d’ou la necessite de normaliser les mesures et done d’introduire la notion de probability. 
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2 : Les methodes de classification multidimensionnelles applicables a la teledetection 




figure 1.7 : Surface de decisions de la methode 
par minimisation de distance de Manhattan 





figure 1.1 1 : Surface de decision de la methode 
de par minimisation de distance de Tchebychev 




figure 1.13 : Surface de decision de la methode 
par minimisation de distance de Mahalanobis 




figure 1.8 : Image resultant de la classification de la figure 
1.2 par minimisation de distance de Manhattan 




figure 1. 10 : Image resultant de la classification de la 
figure 1.2 par minimisation de distance euclidienne 




figure 1.12 : Image resultant de la classification de la 
figure 1.2 par minimisation de distance de Tchebychev 




figure 1.14 : Image resultant de la classification de la 
figure 1.2 par minimisation de distance de Mahalanobis 
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Chapitre I : La classification 




figure 1.15 : Construction d’un ellipsoide representant une classe C suivant deux dimensions 




figure 1.16 : Illustration de la necessite de ponderer la distance euclidienne sA et sB par l’etendue de chaque 
classe (volume des ellipsoi'des). Le point s est plus proche de la classe C 2 , d’ou l’interet de la distance de 

Manahalobis (sA’ et sB’) 
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2 : Les methodes de classification multidimensionnelles applicables a la teledetection 



2.1.3. La methode de classification avec notion de probabilite d’appartenance 

2. 1 .3. 1 . La notion de probabilite et de loi de probabilite 

Le premier usage du mot probabilite apparait en 1370 avec la traduction de l'ethique a 
Nicomaque d’Aristote par Oresme et designe alors « le caractere de ce qui est probable » 
(Oresme, 1940). Le concept de probable chez Aristote est defini dans les Topiques (de Pater, 
1965) par : « Sont probables les opinions qui sont re§ues par tous les hommes, ou par la plupart 
d’entre eux, ou par les sages, et parmi ces derniers, soit par tous, soit par la plupart, soit enfin 
par les plus notables et les plus illustres ». 

La notion d’ opinion collective introduite par Aristote illustre bien la probabilite de prise de 
decision. Chaque decision est prise en fonction de tous les observateurs, quelle que soit leur 
importance, ce qui implique une notion de normalisation et de collectivite. 

La probabilite objective d’un evenement n’existe pas et n’est done pas une grandeur mesurable, 
mais tout simplement une mesure d’ incertitude, pouvant varier avec les circonstances et 
l’observateur, done subjective. La seule exigence etant qu’elle satisfasse aux axiomes du calcul 
des probabilites (Saporta, 2006). 

La theorie mathematique des probabilites ne dit pas quelle loi de probabilite mettre sur un 
ensemble IM parmi toutes les lois possibles. Ce probleme conceme les applications du calcul 
des probabilites, et renvoie a la nature « physique » du concept de probabilite qui formalise et 
quantifie le sentiment d’incertitude vis-a-vis d’un evenement (Saporta, 2006). 

Definissons la notion de probabilite dans un cadre mathematique. 

Definition : On appelle probabilite ou mesure de probabilite sur un espace mesurable (IM, c/V) 
une application P de c -A [0,1] telle que : 

i. V A 6 JL, 0 < P(A) < 1 

ii. P(0) = OetP(IM) = 1 

iii. V A n une suite d'ensembles disjoints de <A, P(U”=i A n ) = Z”=i P(A n ) 

La loi de probabilite la plus utilisee en classification probabiliste est la loi gaussienne car ses 
hypotheses sur les donnees permettent de reduire la complexite de calcul et le risque d’erreur. 
Rappelons que dans le cas de la classification, la loi gaussienne suppose qu’une classe peut etre 
modelisee par son vecteur des moyennes et sa matrice de covariance (De Moivre, 1756)(figure 
1.15). 

2. 1 .3.2. La classification par Maximum de Vraisemblance 

La methode de classification par Maximum de Vraisemblance fut developpee par Fisher en 
1922 (Fisher, 1922). Le principe de cette methode est le suivant : chaque pixel de 1’ image sera 
associe a la classe dont il maximise la probabilite d’appartenance. 
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Chapitre I : La classification 





figure 1.17 : Surface de decision de la methode figure 1.18 : Image resultant de la classification de la 
de classification par maximum de vraisemblance figure 1.2 par la methode de classification par maximum 

de vraisemblance 

La methode de classification par maximum de vraisemblance revient a chercher c° pt , id est la 
classe a attribuer au pixel s, qui maximise sa probability d’appartenance a posteriori (equation 
1.9). 

c s opt = arg max P(C = c s |X = x s ) (1.9) 

C S 

( 1 . 10 ) 
( 1 . 11 ) 

En supposant que Eon ne dispose d’aucune information a priori sur les probabilites relatives 
d’occurrence des classes, P(C = c s ) est constant pour tout s. 

c s ° pt = argmaxP(X = x s |C = c s ) (1.12) 

C S 



Par application de la regie de Bayes, nous obtenons : 



opt P(X = x s |C = c s )P(C = c s ) 

Cs =argm cf 

c° pt = argmaxP(X = x s |C = c s )P(C = c s ) 



En appliquant les hypotheses gaussiennes sur la structure de chaque partition c s , nous obtenons 
ainsi P equation 1.13. 

— (X-PcsV^CX-Pcs) 

c° pt = arg max -p- (1.13) 

l^r ZTT "/ 2 

I Cs I 

Avec n la dimension de l’univers des donnees IM (c’est a dire le nombre de plans de l’image, 
temporels ou spectraux). 

Comme pour le classifieur par minimisation de distance de Mahalanobis, les surfaces de 
decision du maximum de vraisemblance sont representees par des hyper-ellipsoides (figure 
1.17). Les aires des ellipsordes sont differentes pour la methode de minimisation de distance de 
Mahalanobis et celle du maximum de vraisemblance, meme si cette difference est assez faible 
dans notre exemple. 
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2 : Les methodes de classification multidimensionnelles applicables a la teledetection 



2. 1 .4. Les methodes de classification non parametriques a noyaux 

A la difference des methodes presentees precedemment, il n’y a ici aucune estimation de 
statistique a partir des echantillons. Ces methodes sont done particulierement interessantes 
lorsque le nombre de points de certains echantillons est limite. Dans certaines conditions, la 
nature des echantillons ne permet pas un echantillonnage suffisant, exemple des zones urbaines 
tres heterogenes et riches en diversite de classe. Inversement, lorsque le nombre d’ echantillons 
est trop important, la complexite de calcul des methodes de classifications non parametriques a 
noyau devient trop elevee et les resultats peuvent etre deteriores du fait de la consideration de 
certains pixels non significatifs. 

Parmi ces methodes de classification non parametriques a noyau, nous introduirons les 
methodes Support Vector Machines et Reseaux neuronaux. 

Nous n’entrerons pas ici dans les details des methodes et nous ne foumirons que les elements 
necessaires a la comprehension globale des methodes et de leurs avantages et inconvenients 
vis-a-vis des autres methodes citees precedemment, laissant ainsi le lecteur interesse se diriger 
vers la bibliographic fournie. 

2. 1 .4. 1 . La methode des Support V ectors Machines (S VM) 

Les methodes d’apprentissage a noyau et plus particulierement les Support Vectors Machines 
(SVM) ont ete introduites depuis plusieurs annees en theorie d’apprentissage pour la 
classification et la regression (Vapnik, 1998). L’application des SVM a commence avec la 
reconnaissance de texte (Joachims, 1998) puis la reconnaissance de visage (Osuna, Freund, & 
Girosit, 1997). Plus recemment, cette methode est appliquee a la classification d’images de 
teledetection (Huang, Davis, & Townshend, 2002; Melgani & Bruzzone, 2004; Roli & Fumera, 
2001; J. Zhang, Zhang, & Zhou, 2001). 

Le principe original de la methode est simple, il consiste a rechercher une surface de decisions 
ou hyperplan afin de separer deux classes. La surface de decisions sera determinee par un sous- 
ensemble des echantillons d’apprentissage afin de maximiser la discrimination des deux 
classes. Les elements de ce sous ensemble sont appeles vecteurs de support (figure 1.19). 
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figure 1.19 : Illustration de la notion de vecteurs de support ou « support vectors », source anonyme 

Cette approche est interessante puisque l’optimisation est supposee maximiser directement la 
performance de la classification. Le noyau (ou systeme d’equations de l’hyperplan) peut 
prendre plusieurs formes et nous citerons les plus utilisees : noyau lineaire (figure 1.20 et figure 
1.21), noyau polynomial (figure 1.22 et figure 1.23) et noyau gaussien (figure 1.24 et figure 1.25). 

Lorsque les deux classes ne sont pas lineairement separables, la methode consiste a projeter les 
donnees dans des dimensions superieures dans lesquelles les classes seront lineairement 
separables. 

L’algorithme de classification SVM a ete initialement prevu pour la classification binaire, 
neanmoins deux methodes existent pour etendre cet algorithme a la classification multi-classes. 

La premiere methode est appelee « un contre les autres » et consistent a determiner pour chaque 
classe une surface de decisions entre la classe et toutes les autres, ce qui donne #C surfaces de 
decision. Cette methode est illustree aux figures 1.20, 1.22 et 1.24. 

La deuxieme methode appelee « un contre un » consiste quant a elle a calculer la surface de 
decision entre chaque classe et chacune des autres classes, d’ou l’obtention de #C x (#C — 1) 
surfaces de decision. Cette methode est illustree aux figures 1.21, 1.23 et 1.25. La seconde 
methode est la plus performante mais aussi la plus couteuse en calcul. 

Afin de combiner les surfaces de decision, des methodes de fusion sont appliquees. Certaines 
de ces methodes seront citees au chapitre 4. 

Les figures 1.27 a 1.29 illustrent les resultats de ces trois classifications par methode SVM sur 
l’exemple de la fleur. 
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2 : Les methodes de classification multidimensionnelles applicables a la teledetection 




figure 1.20 : Illustration hyperplan separateur pour le figure 1.21 : Illustration hyperplan separateur pour le 
cas « 1 contre les autres » et un SVM a noyau lineaire cas « 1 contre 1 » et un SYM a noyau lineaire 





figure 1.22 : Illustration hyperplan separateur pour le figure 1.23 : Illustration hyperplan separateur pour le 
cas « 1 contre les autres » et un SVM a noyau cas « 1 contre 1 » et un SVM a noyau polynomial 

polynomial d’ordre 2 d’ordre 2 



[7 Separable 



No. of Support Vectors: 4 ( 0.9%) 



No. of Support Vectors: 10 ( 3.3%) 



[ 7 ] Separable 



[ 7 ] Separable 



No. of Support Vectors: 4 ( 0.9%) 



No. of Support Vectors: 18(6.0%) 



figure 1.24 : Illustration hyperplan separateur pour le figure 1.25 : Illustration hyperplan separateur pour le 

cas « 1 contre les autres » et un SVM a noyau cas « 1 contre 1 » et un SVM a noyau gaussien 

gaussien 
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2. 1 .4.2. La methode des Reseaux Neuronaux 

Le modele des reseaux de neurones le plus utilise pour la classification d’ images de 
teledetection est le perceptron multicouche avec entrainement par algorithme de retro 
propagation (Rumelhart, Hintont, & Williams, 1986). 

Le perceptron multicouche comprend une couche d’ entree (les images a classer) et une couche 
de sortie (les classes a attribuer). Entre ces deux couches, une ou plusieurs couches cachees 
peuvent etre positionnees. Apres la phase d’apprentissage, le systeme agit en « boite noire » : a 
un pixel d’ entree correspond une classe de sortie. 

La correspondance attendue entre la couche d’ entree et la couche de sortie ne pouvant etre 
absolue, le perceptron se comporte comme un approximateur. Un compromis devra done etre 
trouve entre le nombre de couches cachees (et de neurones les composant) et la qualite 
d’ approximation du systeme (figure 1.26). 

Couche entree Couche sortie 




Cl 



c 2 



C 3 



C 4 



figure 1.26 : Exemple de perceptron a deux couches cachees avec en entree les images par date et par canal et en 
sortie une decision sous forme d’attribution de classe de l’ensemble C. 

Les details des algorithmes et les demonstrations associees sont disponibles dans (Collet, 2001). 

La figure 1.30 illustre la classification par methode des reseaux de neurones sur l’exemple de la 
fleur. 
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figure 1.27 : Image resultant de la classification de la figure 1.28 : Image resultant de la classification de la 
figure 1.2 par la methode de classification SVM a figure 1.2 par la methode de classification SVM a 
noyau lineaire noyau polynomial de degre 2 





figure 1.29 : Image resultant de la classification de la 
figure 1.2 par la methode de classification SVM a 
noyau gaussien 



figure 1.30 : Image resultant de la classification de la 
figure 1.2 par la methode de classification par reseaux 
de neurones avec noyau polynomial d’ordre 2 
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2.2. La methode de classification dit « objet » 

Le principe des methodes de classification dites « objet » est de ne plus considerer l’element a 
classer comme un pixel mais plutot comme un ensemble de pixels que Ton nommera objet. Cet 
objet peut etre defini de plusieurs facons, l’approche qui sera developpee par la suite est la 
definition d’objet par segmentation. 

2.2. 1 . La notion d’objet obtenu par segmentation 

Afin d’obtenir ces objets, il convient de regrouper les pixels par affinite, le plus generalement 
par homogeneite des valeurs. 

Dans le cas d’un regroupement par homogeneite de valeurs, la formation de ces objets 
commence par le calcul d’une image de gradient (ou image de force de contour) ce qui permet 
de donner un poids a chaque contour suivant la force de l’heterogeneite detectee. Celle-ci peut 
avoir ete obtenue par tout type de filtre (Sobel, etc. . .). 

La detection des contours se fait de la maniere suivante : a partir d’un premier point du contour 
presume, on effectue par connexite un suivi de contour grace aux renseignements obtenus 
durant la recherche tels que sa direction ou sa longueur. Avec ces elements, le contour est 
reconstruit pour en faire un contour ferme en regroupant les points detectes (figure 1.31). 

Une fois que les contours sont determines et fermes, on peut segmenter l’image par la methode 
des bassins versants (Beucher & Lantuejoul, 1979). La segmentation se base sur l’image de 
force de contours qui s’interprete comme une surface dont les lignes de crete correspondent aux 
contours de l’image. Pour detecter les lignes de crete on simule une « inondation » de la surface. 
Ses « vallees » vont etre noyees et des bassins vont se former. Dans un premier temps on 
« remplit ces bassins » jusqu’a une hauteur predeterminee SI (le seuil de detection), telle que 
seuls les pics les plus hauts emergent, separant l’eau en plusieurs « lacs » distincts. L’inondation 
jusqu’au niveau SI fait disparaitre les sommets les plus bas, c’est-a-dire ceux qui ne 
represented pas de contours significatifs, puis un identificateur est attribue, unique a chaque 
bassin forme (figure 1.32. a). 

Une fois que les bassins sont formes et etiquetes, on fait monter l’eau d’un niveau 
supplementaire. En grossissant, des bassins qui etaient jusqu’alors isoles vont se toucher. Ainsi 
si un point est le lieu de reunion de deux bassins portant des etiquettes distinctes, ce point peut 
etre marque definitivement comme frontiere (figure I.32.b). L’execution se termine lorsque tous 
les points de la surface sont immerges. A ce stade les points marques comme frontieres 
constituent les contours de 1’ image. 

L’image segmentee par les bassins versants est etiquetee et les caracteristiques (moyenne et 
variance par exemple) sont calculees sur chacune des regions. Les regions voisines sont ensuite 
comparees par l’intermediaire d’un critere. Les couples de regions qui ne satisfont pas les 
limites imposees seront alors fusionnes. Ce principe permet ainsi de regrouper les regions 
homogenes. On peut ainsi regler la precision de la segmentation obtenue. Les figures 1.34 a 1.36 
illustrent le principe de la segmentation et de la fermeture des contours sur l’image de la fleur. 
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figure 1.31 : En haut, a gauche, 1’ image de gradient, a 
droite 1’ image de force des contours. 

En bas, l’agrandissement sur la prison de la ville de 
Muret, avec a gauche 1’ image de gradient et a droite 
1’ image de contours. 






figure 1.32 : (a) a gauche l’inondation au niveau 4 
(b) a droite l’inondation au niveau 5 pour determiner les frontieres du niveau 4 
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figure 1.33 : Image originale de la fleur 




figure 1.34 : Image des gradients obtenus a partir des 
ecarts-type calcules sur l’image de la figure 1.33 



figure 1.36 : Image obtenu a partir de l’image de la 
figure 1.35, d’un choix de force et d’une fermeture du 
contour. 





2.2.2. La classification des objets 

Afin de classer les objets, il convient de calculer une distance entre deux ensembles. Pour cela, 
une distance et une divergence permettent de decider de cet appariement : la distance de 
Bhattacharyya (equation 1.6) et la divergence de Kullbach-Leibler symetrique (equation 1.7). 

La distance de Bhattacharyya est la plus souvent employee car elle dispose de proprietes 
supplementaires vis-a-vis de la divergence de Kullbach-Leibler (paragraphe 2.1.2). 

Cet algorithme attribue a l’objet o la classe la plus proche c° pt (equation 1.14). 

c° pt = ar gmin d bhata (o,c 0 ) (1.14) 

Cq 

Cette methode est par definition tres dependante du choix lors du seuillage des objets. Prenons 
l’exemple de deux seuillages differents et de leur etiquetage par la methode des bassins versants 
(figure 1.37 et figure 1.38). Les images classees resultantes sont respectivement presentees aux 
figures 1.39 et 1.40. Dans les deux cas, nous observons que le choix de la taille de l’objet est 
bien adapte a la classe verte ; dans le cas de l’image de la figure 1.40, la taille des objets est bien 
adaptee a la classe jaune mais dans aucun des cas a la classe rouge. A chaque classe devrait 
done correspondre un choix de seuil different, ce qui compliquerait 1’ algorithme et le choix du 
seuil. Ceci est une perspective de recherche interessante dans le domaine de la classification 
d’ objets. 
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figure 1.37 : Etiquetage de 1’ image fleur avec un seuil 
de valeur 10 sur une echelle de 1 a 50 



figure 1.38 : Etiquetage de 1’ image fleur avec un seuil 
de valeur 20 sur une echelle de 1 a 50 







figure 1.39 : Classification des objets de l’image de la 
figure 1.37 



figure 1.40 : Classification des objets de f image de la 
figure 1.38 
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2.3. Les methodes de classification dites « globales » 

L’interet de ces methodes se situe dans l’aspect spatial du traitement qui permet de donner une 
probabilite a priori d’une classe pour toute l’image, c'est-a-dire dans sa globalite. En pratique, 
les hypotheses markoviennes permettent de reduire cette dependance globale aux voisins les 
plus proches de chaque point a classer. Cet outil simple et efficace s’appelle les champs de 
Markov. 

Ces methodes ont ete introduites par Geman & Geman (Geman & Geman, 1984) pour la 
classification d’images bruitees. Ces methodes ont ete ensuite appliquees aux images radar mais 
egalement a d’autres types d’images (Kato, Zerubia, & Berthod, 1999; Kato, Zerubia, & 
Berthod, 1992). L’idee fondamentale des methodes de classification globale repose sur les 
Champs de Markov (CAM) (Cocquerez & Philipp-Foliguet, 1995; Pony, Descombes, & 
Zerubia, 2000). 

Commengons par definir les notions de voisinage et de champs de Markov. 

2.3.1. La notion de voisinage 

Rappelons que les notations sont disponibles au tableau 1.1. 

Definition : Un champ aleatoire V defini sur un ensemble de sites S est markovien si et 
seulement si la probabilite d’observer une valeur x s en un site s ne depend que d’un nombre 
fini de sites voisins V s (avec V le systeme de voisinage). 

Considerons une famille arbitraire V de « voisinages locaux » de S : 

V = {V s , s e S\{s}} (1.15) 

A cette famille de voisinage est associee une classe de distribution de probabilites appelee 
champ de Markov et caracterisee par la propriete 1.16. 

Propriete : Soit p(x s ) la probabilite d’occurrence de x s , p(x s ) > 0 pour toute configuration de 
x s alors : 

p(x s |x r , r 6 S\{s}) = p(x s |x r , r 6 V(s)\{s}) (1.16) 

La valeur des autres sites r est supposee connue. 

A un systeme de voisinage donne correspond un ensemble de cliques (figure 1.41). 

Definitions : Une clique est un ensemble de points du treillis mutuellement voisins, Yordre 
d’une clique correspond au nombre de sites qui composent la clique. 

On notera CL 1’ ensemble des cliques et cl une clique de CL. 
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Voisinage 8-connexe 



O 



Clique d'ordre 1 



Cliques d'ordre 3 






Cliques d'ordre 2 

•• : 




Cliques d'ordre 4 




figure 1.41 : Schema representant les cliques possibles pour un voisinage 8-connexe. 



Definition : On appelle fonction energie toute fonction U(c x ) que Ton peut decomposer sur 
l’ensemble des cliques CL de l’image (a-additive) et qui peut s’exprimer sous la forme d’une 
somme de potentiels associes a ces cliques : 



U(c s )= ^ 



V c i(c s ) avec s le pixel central et c s £ C 



(1.17) 



cleCL 



En general, les champs de Markov sont stationnaires {id est independant de la position du site 
s) et la fonction potentielle est independante de la position de la clique (Ducrot, 2005). 

Le theoreme de Hammersley-Clifford (Besag, 1974; Hammersley & Clifford, 1968) permet de 
caracteriser les champs de Markov en termes globaux a partir de la probabilite a priori d’une 
configuration des classes p(C=c). II permet d’etablir une correspondance entre un champ de 
Markov et un champ de Gibbs lorsqu’aucune realisation de C n’est de probabilite nulle. 

Theoreme Hammersley-Clifford : Un champ aleatoire C defini sur un reseau de site S fini et 
denombrable est un champ de Markov relativement a V un systeme de voisinage borne si et 
seulement si C est un champ de Gibbs de potentiel associe a V. 

La distribution de probabilite a priori p(c) est done une distribution de Gibbs defini par : 

, N 1 U(c) 

p(c) = — e t , avec Z constante de normalisation et T variable de "temperature" 

Zj 

La constante de normalisation Z est aussi appelee fonction de partition et assure que p(c) 
definisse bien une mesure de probabilite. Z s’exprime par l’equation 1.18. 



Z = 



I 

cec 



U(c) 
e t 



(1.18) 
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La variable de « temperature » T a ete ajoutee au processus ICM afin de ponderer la fonction 
energie. En pratique, la variation de ce parametre de temperature permet de regler la vitesse 
convergence de l’algorithme. Ce principe est issu de la methode du recuit simule (Kirkpatrick, 
Jr, & Vecchi, 1983)). 

Nous voyons done que la probability d’une configuration ne depend que d’un ensemble 
d’ interactions locales. En outre, plus l’energie totale U(c) est grande, moins la configuration est 
possible. 

Plusieurs modeles existent pour definir la fonction potentielle V c i(x). Nous citerons en exemple 
le modele de Potts (Potts, 1952) ou encore le « chien-modele » (Descombes, Mangin, Sigelle, 
& Pechersky, 1995) qui permet de conserver les structures fines et lineaires a partir d’une image 
de contour (paragraphe 2.2.1). 

2.3.2. Les methodes de classification contextuelle 



Pour des estimateurs de Maximisation a posteriori (MAP), plusieurs methodes de classification 
contextuelle basee sur un CAM existent telles que la methode du recuit simule (algorithme 
stochastique) ou 1’ Iterated Conditional Mode (ICM, algorithme deterministe). Les modeles 
stochastiques sont beaucoup plus performants et permettent une convergence vers un maximum 
global alors que les algorithmes deterministes sont plus rapides mais peuvent converger vers 
un maximum local (Ducrot, 2005). 

Nous presenterons dans la suite du manuscrit plusieurs methodes basees sur l’utilisation de 
1’algorithme ICM du fait de sa performance, de sa rapidite et de sa robustesse. 

2.3.3. Minimisation de l’energie a posteriori par la methode ICM 



La methode Iterative Conditional Mode (ICM) est une methode de recherche deterministe 
proposee par Besag (Besag, 1974). Cette methode iterative permet d’approcher la solution 
optimale du MAP en affectant a chaque pixel s la classe qui maximise la probability 
conditionnelle d’appartenance. 



Dans un cadre bayesien, le probleme peut etre modelise de la fagon suivante : soit C une variable 
aleatoire representant le champ des etiquettes possibles, X etant une variable aleatoire 
representant les valeurs des pixels s (en general C c MetXc R n ). Par application du 
Maximum A Posteriori (MAP), la regie de Bayes permet d’ecrire : 



P(C = c|X = x) 



P(X = x|C = c)P(C = c) 
P(X = x) 



(1.19) 



P(X = x) est une constante et P(X = x|C = c) decrit le processus d’observation des donnees. 
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Plusieurs hypotheses sur les donnees sont posees pour la resolution de ce probleme : 
Hypothese 1 : independance conditionnelle des pixels : 



P(X = x|C = c) = Y\ p ( X = x slC = c s ) 



( 1 . 20 ) 



selM 



Hypothese 2 : hypothese markovienne : 



1 U(c) 

P(C = c) = -e-— 



( 1 . 21 ) 



Rappelons que Z est la constante de normalisation et T la variable de « temperature ». 
Nous pouvons ainsi ecrire : 



On constate bien que la distribution a posteriori est une distribution de Gibbs et done que le 
champ C conditionnellement a X est un champ de Markov d’apres le theoreme de Hammersley- 
Clifford. La configuration c s qui nous interesse est done celle qui maximise la probabilite a 
posteriori P(C = c s |X = x s ) ou encore celle qui minimise l’energie W(c s ,x s ). 

2.3.4. La classification par methode ICM 

Rappelons que la classification par methode ICM est une methode iterative basee en regie 
generate sur un classifieur de type Maximum de Vraisemblance classique comme presente au 
paragraphe 2. 1.3.2. Puis a chaque iteration de Palgorithme ICM, une nouvelle probabilite est 
calculee en fonction du contexte nominal du pixel id est la classe attribute au voisinage du pixel 
a classer. L’ecriture de la probabilite a posteriori a maximiser a ete introduite a P equation 1.22 

A chaque pixel s de l’image, le but est de trouver c° pt id est la classe a attribuer au pixel s qui 
maximise la probabilite a posteriori. 



P(C = c s |X = x s ) * P(X = x s |C = c s )P(C = c s ) 
~ glnP(X = X S |C = C s )-U(c s ) 

~ e -W( c s ,x s ) 



( 1 . 22 ) 



Avec 



W(c s ,x s ) = -lnp(x s |c s ) + U(c s ) 




cl £ CL 



(1.23) 



c s opt = argmaxP(C = c s |X = x s ) 



(1.24) 
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Nous avons montre que ce probleme etait equivalent a : 

c s ° pt = arg maxP(X = x s |C = c s )P(C = c s ) (1.25) 

C S 



Dans le cadre de la modelisation gaussienne des donnees, on suppose que chaque classe c peut 
etre modelisee par une loi gaussienne. Pour chaque classe c, le vecteur des moyennes et la 
matrice de covariance des pixels pour chaque date d et bande spectrale k sont calcules et notes 
respectivement p c et X c . On peut done reecrire l’equation 1.25 de la maniere suivante : 



opt 

c~ = arg max 

C S EC 




(x-nc s ) T s Cs 1 (x-nc s ) 



E c 1 1/2 2n d / 2 

C S I 



s' U(c s ) 

x e t 



(1.26) 



Ce qui revient a minimiser l’energie W(c s ,x s ), d’ou 



c s opt = argmin (x - q Cs ) T ^/(x - p s ) + In (| I Cs | 1/2 2n d/2 ) + (1.27) 



Rappelons que T est la variable de temperature qui nous permet d’accelerer la convergence de 
c° pt vers son optimum au fur et a mesure des iterations. Ce parametre permettra egalement 
d’empecher la convergence de l’algorithme vers un maximum local. 

L’algorithme est compose de deux types d’iteration : les iterations interieures ou iteration 
markoviennes qui permettent la gestion de la convergence et les iterations exterieures basees 
sur le principe des nuees dynamiques et qui permet la convergence des statistiques. En pratique 
pour la classification supervisee, il n’y a pas d’iterations exterieures. 

L’algorithme ICM est presente ci-apres et illustre par la figure 1.42. La figure 1.43 illustre le 
resultat de la classification de 1’ image de la fleur par la methode de classification ICM. 



Algorithme de classification Iterated Conditional Mode (ICM) : 

Entree IM : ensemble d’images a classer 

C : 1’ ensemble des classes de reference 
Initialisation Estimations des statistiques 

Classification par Maximum de Vraisemblance 
(ou tout autre classifieur) 

Tant que le nombre d’iterations exterieures n’est pas atteint ou que le critere d’arret 
n’est pas verifie 

Re-estimation des statistiques de C 
Pour chaque iteration interieure 

Calcul des fonctions energie en chaque pixel 
Classification de chaque point avec utilisation de la fonction 
energie 
Fin Pour 

Decroissance de la temperature de convergence 

Fin Tant que 
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figure 1.42 : Schema illustrant le deroulement de 1’algorithme ICM, valable pour le mode supervisee et non 

supervisee 




figure 1.43 : Image resultat de la classification par methode ICM 
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2.4. Amelioration du processus ICM : ajout d’ informations exogenes 

Une amelioration importante a ete apportee a la methode ICM pour qu’elle soit utilisable dans 
toutes les conditions (type de donnees) et sur de larges zones d’etude (taille d’image, gestion 
des imperfections). J’ai ainsi introduit l’utilisation de donnees exogenes, qualitatives ou 
quantitatives, au processus de classification afin de l’ameliorer. Ces donnees peuvent etre, par 
exemple, l’information de l’altitude, la restriction de classes ou encore le masquage des donnees 
alteres ou manquantes. 

La premiere information apportee est une restriction des classes possibles lors du processus de 
decision en fonction du contexte dans lequel se trouve le pixel. Cette methode se base sur la 
theorie des possibility. Prenons l’exemple concret presente a la figure 1.44. Nous avons ajoute 
une information de type qualitative sur la possibility de presence de certaines classes en fonction 
de l’altitude dans le massif pyreneen. Nous avons, par exemple, interdit la presence de cultures 
au-dessus de 1300 metres d’altitude. Cette methode permet d’ameliorer la rapidite du processus 
et de reduire les confusions liees a la nature des echantillons, et done aux erreurs a priori. 




figure 1.44 : Exemple de restriction de classes possibles en fonction des regions predefinies : ici les Pyrenees 
orientales avec une restriction par palier d’altitude. En blanc de 0 a 800m, en bleu de 800 a 1300m et en bleu 

plus de 1300m. 

La seconde information apportee est celle du marquage du manque ou de 1’ alteration de 
donnees. En certains points, l’information acquise peut etre alteree ou masquee (defauts de 
capteur, nuages, etc.). II convient done de masquer ces informations a 1’algorithme de 
classification afin que 1’ initialisation et le deroulement de la classification se fasse 
correctement. Cette methode est particulierement delicate avec l’utilisation de la methode 
parametrique ICM du fait de la presence d’un nombre important de combinaisons 
d’apprentissage. 
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3. La classification non supervisee et son interpretation 

Comme nous l’avons vu en introduction de ce chapitre, la limitation des methodes de 
classification supervisee, quel que soit le classifieur, reside dans la necessite d’utiliser des 
echantillons et done une vue restrictive et non objective de la realite. II est meme parfois 
impossible d’effectuer une classification supervisee faute de disponibilite de verites terrain 
(annee passee, zone inconnue ou inaccessible). 

Dans ces deux cas, il faut alors appliquer des methodes de classifications non supervisees. Le 
principe de ces methodes est similaire aux methodes supervisees presentees precedemment, a 
la difference pres qu’il faut ajouter une etape d’apprentissage non dirigee ou d’ exploration, qui 
permettra d’initialiser le processus. 

Parmi les methodes de classification non supervisees, nous citerons la methode du K-means 
(Duda, Hart, & Stork, 2012) et celle de l’ISODATA (Ball & Hall, 1965). Nous avons egalement 
associe a l’algorithme ICM un processus d’apprentissage non supervise base sur les nuees 
dynamiques (Diday, 1971). Deux exemples de cette methode de classification sont presentes 
aux figures 1.45 et 1.46. 




figure 1.45 : Image resultante d’une classification non figure 1.46 : Image resultante d’une classification non 
supervisee de type ICM avec 3 classes. supervisee de type ICM avec 5 classes. 



Ces methodes ne sont toutefois pas entierement automatique et peuvent necessiter la definition 
arbitraire du nombre de classes (ou intervalle de valeurs) ou encore de la maniere de regrouper 
et separer des classes. 

Pour une utilisation thematique des resultats, une interpretation de 1’ image obtenue par la 
classification non supervisee est necessaire, ce qui revient a trouver une etiquette adequate a 
chaque classe obtenue par la classification non supervisee. 

II convient de preciser que 1’ ensemble des classes depend generalement de la zone a classer, de 
la resolution du capteur ou encore de la nature du capteur lui-meme. Une approche nouvelle 
visant a repondre a ce probleme sera presentee au chapitre 5. 
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4. Application et comparaison des different^ classifieurs avec des donnees de 
teledetection multidimensionnelles . 

Nous presenterons ici quelques resultats afin d’illustrer la comparaison des classifieurs 
introduits dans ce chapitre. L’application est la suivante : nous allons effectuer la cartographie 
de l’occupation du sol a partir d’images Formosat-2 (optique, 8 metres resolution, 4 bandes 
spectrales : Bleu, Vert, Rouge et Proche-Infrarouge) sur l’annee 2009 et d’un ensemble de 
classes thematiques acquises par des verites terrain. Les caracteristiques de ce capteur, des 
images et des classes utilisees sont presentes en annexe 1.3. Les images utilisees possedent 
chacune 16 dates et 4 bandes spectrales et une emprise de 24x24 km 2 . L’evaluation ne sera ici 
que visuelle, la validation numerique a l’aide d’un second jeu d’ echantillons de verification sera 
presentee en application du chapitre 2. 

Des extraits de resultats sont presentes aux figures 1.47 et 1.48. La methode de classification par 
seuillage est la plus mauvaise, peu de points sont correctement classes. Les differences entre 
les autres methodes sont mineures, nous citerons notamment les confusions entre classes de 
cultures pour la minimisation de distance euclidienne (e), la bonne classification des cultures 
pour l’algorithme ICM (1) et 1’ amelioration par rapport au maximum de vraisemblance (g), la 
bonne classification des classes de bati et d’eau pour l’algorithme SVM notamment pour le lac 
de droite (h et i) et enfin les confusions de la classification objet pour les parcelles heterogenes 
(k). 





(a) Composition coloree RVB en couleur reelle de la 
date du 01/07/2009 



(b) Composition coloree RVB en fausse couleur 
(PIR, R, V) de la date du 01/07/2009 





(c) Echantillons utilises (apprentissage et 
verification) 



(d) Methode de seuillage des parallelepipedes 



figure 1.47 : Applications aux images Formosat-2 annee 2009, (a) et (b) exemples de compositions colorees, (c) 
les echantillons utilises pour la classification et la validation et (d) le resultat de la classification pour la methode 

de seuillage des parallelepipedes. 
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4 : Application et comparaison des differents classifieurs avec des donnees de teledetection 

multidimensionnelles. 





(e) Methode de minimisation de distance euclidienne 




(g) Methode du maximum de vraisemblance 





(h) Methode SVM a noyau lineaire 




(j) Methode des reseaux de neurones 




(k) Classification objet metrique de Bhattacharyya (1) Methode ICM 
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figure 1.48 : Extraits des images resultats des methodes de classifications (e) a (1) 
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Chapitre I : La classification 



5. Conclusion 

La citation de Brunot resume le probleme fondamental de la classification : « Si les nuances 
infinies du langage ne s'accommodent point des classifications rigides qu'on veut faire, tant pis 
pour les classifications. La science doit s'accommoder a la nature. La nature ne peut 
s'accommoder a la science. » (Ferdinand Brunot, 1922). Quelles que soient les methodes 
presentees dans ce chapitre, qu’elles soient parametriques ou non, avec une approche 
ponctuelle, objet ou globale ou encore supervisee ou non supervisee interpretee, toutes ces 
methodes dependent du point de vue subjectif de la definition des classes thematiques 
composant la scene observee. 

Chacune de ces methodes possede ses caracteristiques propres. Les methodes parametriques 
sont tres efficaces mais necessitent un nombre minimum de points d’echantillonnage 
contrairement aux methodes non parametriques a noyau qui peuvent se contenter de peu de 
points, mais qui, en contrepartie, demandent beaucoup de temps de calcul lorsque le nombre de 
classes et d’ images est important. 

Pour ce qui est de la consideration de l’objet a classer, la methode globale ICM apporte 
l’information du contexte au principe de la classification, ce qui permet une amelioration de la 
qualite (visuelle) et des performances (voir chapitre 2). En plus, nous avons ajoute la 
consideration d’ informations exogenes dans le processus de classification, ce qui a permis la 
gestion de donnees telles que 1’ information de 1’ altitude, la restriction de classes ou encore le 
masquage des donnees alteres ou manquantes (defauts, nuages,. . .). 

Dans ce chapitre, nous n’avons pas parle de 1’evaluation de la classification, ceci fera l’objet du 
chapitre suivant. Afin d’ameliorer le systeme de classification, les chapitre 3 et 4 seront 
consacres a la selection de donnees en entree du processus de classification afin de reduire la 
redondance et la complexite des calculs ainsi qu’a l’utilisation de la complementarite des 
classifications et de leur fusion. 
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Chapitre II. L’ evaluation de la classification 



Resume : La validation du resultat de classification est une etape importante du processus 

car elle permet de s’ assurer de la performance des resultats obtenus et ainsi de la 
significativite des analyses leur succedant. L’interet de ce chapitre sera de 
determiner un indice unique permettant de mesurer simultanement plusieurs 
caracteristiques de la classification. Ce critere de performance sera un outil 
important de recherche et d’optimisation de la performance des classifications. 
Ce nouvel indice sera compare aux indices preexistants sur des exemples simples 
ainsi que sur des exemples concrets. J’introduirai egalement une nouvelle 
matrice de confusion qui permettra de tenir compte de l’incertitude de la prise 
de decision pour le calcul de la performance d’une classification supervisee. 

Mots cles : matrice de confusion, performance, precision, rappel, incertitude, similitude. 
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Chapitre II : L’ evaluation de la classification 
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1 : L’ evaluation de classification : definitions et contexte 



1. devaluation de classification : definitions et contexte 

1.1. Contexte 

La validation du resultat de classification est une etape importante du processus car elle permet 
de s’ assurer de la performance et de la significativite des resultats obtenus. 

Dans le cadre d’un processus supervise, deux jeux d’echantillons sont acquis, la partie 
apprentissage est utilisee pour initialiser le processus de classification tandis que la partie 
verification est utilisee pour valider le resultat de la classification a travers le calcul d’une 
matrice de confusion. 

Dans ce chapitre, je presenterai deux extensions de la matrice de confusion, la premiere avec 
l’integration de la notion de probability, la seconde avec l’integration de similitude de classe. 
Je presenterai ensuite deux nouveaux indices extraits des matrices de confusion qui permettront 
de synthetiser l’information a travers un indice unique. 

L’interet d’obtenir un indice unique permettant de mesurer simultanement plusieurs 
caracteristiques de la classification sera un outil important pour les chapitres suivants qui 
l’utiliseront comme critere de recherche et d’optimisation. 

1 .2. Definitions 

Commengons par preciser quelques termes qui seront largement utilises dans la suite du 
manuscrit. En anglais, deux termes sont employes pour decrire la performance d’une 
classification : « precision » et « recall ». Ces deux termes sont respectivement traduits en 
fran§ais par « precision » et « rappel » (Davis & Goadrich, 2006; Grossman & Frieder, 2004). 

Pour le terme precision, il existe en anglais deux mots : « precision » et « accuracy ». 
L’« accuracy » correspond a la justesse, l’exactitude ou encore la decision correcte. La 
« precision » correspond au niveau de details. La definition d’une classe peut devenir de plus 
en plus precise. On peut mieux definir la classe « cultures » en « cultures d’ete » et « cultures 
d’hiver », puis les cultures d’hiver en classes de « ble », « orge », .... Enfin la classe de « ble » 
peut egalement etre decrite en « ble tendre » et « ble dur ». La description des classes est done 
devenue plus precise et la classification sera plus detaillee. 

Dans le reste du document, nous emploierons les termes de performance, rappel et precision 
definis de la maniere suivante : 

Definition : On appelle performance d’une classification un resultat chiffre permettant de 
mesurer l’exactitude du resultat d’une classification. 

Definition : Le rappel d’une classe c est defini comme etant la proportion d’elements bien 
classes par rapport au nombre d’elements appartenant a la classe c dans les donnees de reference 
(echantillons de validation). L’indice evaluant le rappel est appele Producer Accuracy. 

Definition : La precision d’une classe c est defini comme etant la proportion d’elements bien 
classe par rapport au nombre d’elements attribues a la classe c par le processus de decision de 
la classification. La precision est relative a l’erreur d’excedent d’une classe. L’indice evaluant 
la precision est appele User Accuracy. 



41 



te I- 0 0 9 2 1 8 5 3 , v e r s io n 



Chapitre II : L’ evaluation de la classification 





figure II. 1 : Illustration des notions de rappel (proportion de l’aire des bien-classes par rapport a l’aire des 
echantillons de validation) et de precision (proportion de l’aire des bien-classes par rapport a l’aire de la 

classification) 

La difference entre precision et rappel est illustree en figure II. 1 



2. devaluation a partir de references spatiales 

Classiquement, une classification s’evalue a l’aide de references spatiales c’est-a-dire qu’il y 
aura comparaison entre les pixels de 1’ image issue de la classification et ceux de 1’ image servant 
de reference pour la validation. 

2. 1 . La matrice de confusion 



Dans le cadre d’une classification supervisee disposant de references spatiales, la matrice de 
confusion est un outil permettant de mesurer la qualite du systeme de classification utilise. 

Definition : La matrice de confusion est un outil permettant de mesurer la concordance entre 
un ensemble d’elements observes et un ensemble d’elements de reference. Ici les elements 
observes correspondent aux pixels issus de la classification et les elements de reference a nos 
echantillons de verification. 

Notations : Soit la matrice de confusion m qui pour chaque couple de classes (c } , Cj) associe le 
nombre de pixels s correspondant a la classe q dans 1’ image de reference mais classes en tant 
de Cj par l’algorithme de classification. Chaque element de cette matrice de confusion m sera 
note m c . c . avec q 6 C, i e [1, #C] et #C le nombre de classes presentes. 
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2 : L’ evaluation a partir de references spatiales 



Z 1 {c° pt =c j )n{cr rif =c i } (III) 

SGSverif 

Rappelons que c° pt et cj erif correspondent a la classe attribute au pixel s respectivement par la 
classification et par l’image des echantillons de verification. La figure II.2 illustre la 
representation de la matrice de confusion. 
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figure II.2 : Representation de la matrice de confusion 

Notons m c . la somme des pixels de reference appartenant a la classe q et m c . la somme des 
pixels de reference classes en tant que Cj par falgorithme de classification. Le nombre total de 
pixels de verification est note N avec : 

N= Z mc " = Z ™ C 1 (II.2) 

ie[l,#C] je[l,#C] 

Nous noterons que la matrice de confusion ne tient compte que de deux etats : 1 si le pixel 
appartient aux 2 categories et 0 sinon. Aucune information sur la certitude de la prise de 
decision, lors de la classification n’intervient dans le calcul de la matrice de confusion. 

Pour cela, j’introduis maintenant une nouvelle matrice de confusion avec integration de la 
notion de probability d’appartenance afin de prendre en compte l’incertitude de la prise de 
decisions. 

2.2. La matrice de confusion par ponderation de probability 

Rappelons que chaque element de la matrice de confusion m est note m c . Cj avec q 6 C, i e 
[1, #C] et #C le nombre de classes presentes 
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Chapitre II : L’evaluation de la classification 



Contrairement a la matrice de confusion classiquement utilisee, nous definissons maintenant 
chaque element m c . c . comme etant la somme des pixels ponderes par leur probability 

d’appartenance p(c° pt = Cj|cJ enf = q). 



La formulation de m est presentee en equation II. 3. 



2 p( c “ pt = 


Cj|c s verif = q) 


SGSyerif 

I . 


P( c s° pt = Cj) 


SGSyerif tq Cg er ^— C] 





(II.3) 



Un exemple de cette matrice est presente en annexe 1.3. 

2.3. Indices pour T evaluation a partir des matrices de confusion 

A partir de la matrice de confusion presentee aux paragraphes 2.1 et 2.2, plusieurs indices 
peuvent etre extraits afin d’evaluer la performance de la classification. 

Nous separerons les indices en 2 categories distinctes : 

les indices dits « locaux », « par classe » ou encore « Un contre Tous », qui permettent 
de juger de la performance d’une classe par rapport aux autres. 

les indices dits « globaux » ou « Tous contre Tous », qui permettent de juger de la 
performance globale de la classification. 

Afin d’illustrer les differents indices qui seront presentes ci-apres, nous prendrons un exemple 
simple a 2 classes defini par le tableau II. 1 . 





Classe 1 


Classe 2 


Somme pixels classes references 


Classe 1 


A 


B 


A+B 


Classe 2 


C 


D 


C+D 


Somme pixels classes attributes 


A+C 


B+D 


N = A+B+C+D 



tableau II. 1 : Exemple pris d’une matrice de confusion a 2 classes 



Nous fixerons les valeurs de la diagonale (A et D) et ferons varier les valeurs hors diagonales 
(B et C) afin d’observer Timplication de ces changements sur les indices presentes ci-apres. 

2.3.1. Les indices « Un contre Tous » 



Les deux indices couramment utilises pour evaluer la performance d’une classe sont le Producer 
Accuracy (PA) et le User Accuracy (UA) : 



Le « Producer Accuracy » (PA) est l’indice qui evalue le rappel d’une classe. 



n 




m Ci,c= 



m r . 



ie 



[o,i] 



(H.4) 
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2 : L’evaluation a partir de references spatiales 



Le « User Accuracy » (UA) est l’indice qui evalue la precision d’une classe. 



ll 

Z m r r . m r . r . 

G [0,1] 

j=i m c . c . m, q 



(II.5) 



De ces deux indices de performance decoulent deux indices d’erreurs, respectivement erreur 
d’omission et erreur de commission : 

L’erreur d’omission represente le deficit d’une classe ou encore la perte de pixels d’une 
classe lors de la classification. 

m c . c . 

Erreur_omissionj = Err_omj = 1 — PA, = 1 — G [0,1] (II.6) 

m Ci „ 



- L’erreur de commission represente l’exces d’une classe ou encore la surrepresentation 
des pixels d’une classe lors de la classification. 

m c . c 

Erreurjmmmissioni = Err_comj = 1 — UAj = 1 — G [0,1] (II.7) 

m .,Ci 

Nous definirons deux types de comportement de classes a partir de ces deux erreurs : 

Les classes dispersibles, qui ont un taux important d’erreurs d’omission et done un PA 
faible. 

Les classes absorbantes, qui ont un taux important d’erreurs de commission et done un 
UA faible. 

2.3.2. Les indices globaux (« Tous contre Tous ») 

Dans la litterature, la diversite d’indices permettant d’evaluer une classification est grande. 
Chaque indice possede une signification et un objectif devaluation precis. Nous decrirons trois 
categories d’indices constitutes comme suit. 

La premiere categorie est constitute des indices orientes « rappel » id est qui mesurent la 
performance en fonction de la reference. Dans cette categorie, nous citerons le « Average 
Accuracy » (AA) qui est une moyenne des « Producer Accuracy » de chaque classe. 

n n 

i v m c c In -1 

AA = - > — ^ = - > PAi G [0,1] (II.8) 

nZ_i m r . n Z_i 

i=i Cl - i=i 



Nous voyons ici un exemple de confusion de terminologie. Le AA est appele « Average 
Accuracy » alors qu’il ne tient compte que du rappel des classes. Cet indice devrait done se 
nommer « Average Recall ». Dans un souci de cohesion, nous conserverons la terminologie AA 
largement utilisee dans notre domaine d’ application. 
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Chapitre II : L’evaluation de la classification 



La seconde categorie est constitute des indices orientes « precision » id est qui mesurent la 
performance en fonction de la classification. Nous introduirons ici le « Average Precision » qui 
est a la precision ce que l’Average Accuracy est au rappel. 

n n 

1 m c . c . 1 v 

AP = - > — ^ = - > UA; G [0,1] (II. 9) 

nZ-i m r . nZ—i 

i=l ' 1 i=l 



La demiere categorie regroupe les indices dits globaux id est qui mesurent la performance « sans 
orientation ». Cette categorie est sans conteste la plus utilisee car elle est par definition globale, 
c’est-a-dire non orientee. Nous citerons tout d’abord le « Overall Accuracy » definit par 
1’ equation II. 10, appele egalement Pourcentage de pixels Correctement Classes (PCC). 

n 

OA = lj j m Ci , Ci e[0 > l] ( 11 . 10 ) 

i=l 



Cet indice represente la proportion de pixels presents sur la diagonale de la matrice de 
confusion. L’OA est un indice de performance global au sens ou il permet de mesurer la 
performance quel que soit la taille des classes contrairement aux indices AA et AP qui 
ponderent cette performance globale en attribuant un poids a chaque classe (le poids etant defini 
par l’effectif de la classe). 

Nous citerons egalement la F-mesure (ou F-score ou encore « F-measure » en anglais, (Bahadur 
& Rao, 1960; Rijsbergen, 1979)) qui est un indice de performance base sur la ponderation des 
notions de precision globale et de rappel global. Le parametre de ponderation est note p et 
1’ indice est defini comme suit : 



F 



P “ 



(1 + p 2 ) x AA x AP 
(P 2 x AP) + AA 



,p G E + 



( 11 . 11 ) 



La valeur p=l est tres largement utilisee car elle permet de donner une moyenne harmonique 
entre le rappel global et la precision globale. Elle est notee F x . 



Fi 



2 x AA x AP 
AP + AA 



,p G E + 



( 11 . 12 ) 



Un autre indice utilise est le Kappa de Cohen qui permet d’estimer le taux de concordance entre 
deux observateurs (Cohen, 1960, 1968; Fleiss, Cohen, & Everitt, 1969). Neanmoins la premiere 
trace de cet indice remonte a 1892 avec (Galton, 1892) mais le Kappa est majoritairement 
attribue a Cohen. Sans etre reellement un indice de performance, le Kappa est utilise pour juger 
de la qualite de la classification multi-classes et cela a tort selon Pontius (Pontius, 2000). 
Neanmoins, cet indice est communement utilise en teledetection (Congalton, 1991; Montserud 
& Leamans, 1962; Smits, Dellepiane, & Schowengerdt, 1999; Wilkinson, 2005) mais 
egalement dans d’autres domaines dont notamment la psychologie (Fleiss et al., 1969; Landis 
& Koch, 1977; Tinsley & Weiss, 1975). 



46 



te I- 0 0 9 2 1 8 5 3 , v e r s io n 



2 : devaluation a partir de references spatiales 



La formulation generate du coefficient de Kappa de Cohen se pose sous la forme : 



Kappa = 



Po-Pe 

1-P» 



e [-1,1] 



(11.13) 



Avec P 0 : la proportion d’accord observee et P e : la proportion d’accord aleatoire. 

Dans le cadre de la comparaison entre une classification et une reference, le Kappa de Cohen 
s’ecrit alors : 



kappa 



N IP = i m c . c . - IP =1 m Cjv x m c . 
N 2 - T.f =1 m c . x m c . ; 

OA - V N 2 1 "=i m q,. x m vC . ^ 

1 - V N 2ir=im Ci ,. x m vC . 



(H.14) 



D’apres Cicchetti (Cicchetti & Fleiss, 1977), le test du Kappa est significatif lorsque N > 2 x 
(#C) 2 , #C le nombre de classes. 

Les limites du Kappa sont grandes. Feinstein et Cicchetti (Feinstein & Cicchetti, 1990) 
decrivent le paradoxe du Kappa lorsque les effectifs marginaux sont non equilibres. Pontius 
(Pontius Jr & Millones, 2011; Pontius, 2000) decrit le Kappa comme etant un indice 
monodimensionnel incapable de justifier la concordance (done la pseudo-performance dans le 
cas de la classification). Les auteurs justifient cette limite par le fait que l’indice confond la 
quantite et la position d’une classe. 

Le deuxieme paradoxe conceme les erreurs systematiques. Ces erreurs entre observateurs 
entrainent un meilleur resultat du test (a tort) car la concordance aleatoire est plus faible. Par 
hypothese, les observateurs doivent etre independants dans le cadre de F evaluation d’une 
classification done les erreurs systematiques n’ont pas lieu d’exister en theorie. 

Plusieurs extensions et ameliorations du Kappa sont proposees par Pontius (Pontius Jr & 
Millones, 2011) afin d’en reduire les paradoxes. Nous en citerons deux, le « Kappa location » 
et le « Kappa quantity ». 

0A_ X / m2 2]|=i m cj,. x m c . 

KJocation = (11.15) 

Zr=imin( H ,^) - V N 2 HP = i m Cj x m. ;C . 

0A - (h + Klocation (£?=i min (J,^) - 

K_quantity = 2 (11.16) 

DJLi — ^ 2 ' + KJocation(X) 

Avec : X = ((1 - - (^+ KJocation (j$ =1 min (H-17) 
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Chapitre II : L’evaluation de la classification 



En opposition au Kappa et a sa notion de concordance, il existe des indices statistiques 
dissociation qui ne tiennent pas compte de la liaison et qui n’exigent pas des variables de 
meme nature. Nous citerons en exemple le coefficient de Kendall (Kendall, 1948) et celui de 
Cramer (Siegel & Castellan, 1988) sans entrer dans les details. 

2.4. Introduction et validation de nouveaux indices 

Dans l’optique d’automatiser les processus lies a la classification, nous devons disposer de 
criteres permettant de juger de la performance de la classification. Afin de limiter et d’unifier 
les criteres presentes dans les paragraphes precedents, nous nous proposons d’introduire 2 
nouveaux indices afin de synthetiser l’information (Masse, Ducrot, & Marthon, 2012). 

Le premier est un indice de performance par classe qui jugera a la fois de la precision et du 
rappel de la classe. Nous appellerons cet indice le « Omission and Commission Index » (OCI) 
car il tient compte a la fois du rappel (l’inverse de l’erreur d’omission) et de la precision 
(E inverse de l’erreur de commission) de la classe a evaluer. 

OCIj = PAj x UAj 

= (1 — Err_omj)(l — Err_comj) (11.18) 

= 1 — Err_omj — Err_comj + Enjoin, x Err_conii 

L’originalite de l’indice OCI repose sur sa capacite a observer a la fois les caracteristiques de 
dispersion et d’absorption des classes. Nous introduisons maintenant une version « Tous contre 
Tous” de cet indice nomme « Average Omission and Commission Index » (AOCI). 

n 

AOCI = - Y OCIj (11.19) 

n/_i 

i=l 

L’AOCI et la Fl-mesure sont des indices proches par definition et qui permettent de regrouper 
les deux caracteristiques importantes que sont la precision et le rappel. 

L’OCI et l’AOCI permettent ainsi de synthetiser l’information a travers un critere unique, ce 
qui permettra de simplifier les algorithmes de recherche et d’optimisation de performance de 
classification qui seront presentes dans les chapitres suivants. 

2.5. Illustrations des indices presentes 

Afin d’illustrer les differents indices qui seront presentes ci-apres, nous prendrons un exemple 
simple a 2 classes defini par le tableau II. 1 . Nous fixerons les valeurs de la diagonale (A et D) 
et ferons varier les valeurs hors diagonales (B et C) afin d’observer Pimplication de ces 
changements sur les indices presentes ci-apres. Posons A = 50 et D = 150 et faisons varier les 
termes non diagonaux de la matrice de confusion qui sont B et C entre 0 et 300. 

Les figures II. 3 a II. 8 illustrent les simulations des indices par classe et les figures II. 9 a 11.14 
illustrent les simulations des indices globaux. 
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2 : L’ evaluation a partir de references spatiales 




Producer Accuracy ou precision de la classe 2 



Producer Accuracy ou precision de la classe 1 




figure II.3 : Simulation de l’indice PA pour la classe 1 



figure II.4 : Simulation de l’indice PA pour la classe 2 




figure II.5 : Simulation de l’indice UA pour la classe 1 



figure II.6 : Simulation de l’indice UA pour la classe 2 




Omission and Commission Index de la classe 1 



Omission and Commission Index de la classe 2 




figure II.7 : Simulation de 1’ indice OCI pour la classe 1 



figure II. 8 : Simulation de 1’ indice OCI pour la classe 2 
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Chapitre II : devaluation de la classification 



Average Accuracy 




figure II. 9 : Simulation de 1’ indice A A 



Average Precision 




figure II. 10 : Simulation de l’indice AP 




Overall Accuracy 



figure II. 11 : Simulation de l’indice OA 



FI mesure 




figure 11.12 : Simulation de l’indice FI mesure 



Kappa de Cohen 




figure 11.13 : Simulation de l’indice Kappa 



Average Omission and Commission Index 




figure 11.14 : Simulation de l’indice AOCI 
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2 : L’ evaluation a partir de references spatiales 



Kappa location Kappa quantity 

xio 4 xio 4 





figure 11.15 : Simulation de Findice Kappa location 



figure 11.16 : Simulation de Findice Kappa quantity 



L’effectif en A etant plus faible que l’effectif en D, la performance de la classe 1 doit « chuter » 
plus rapidement que celle de la classe 2 lors de 1’ augmentation des effectifs hors-diagonal. Ce 
phenomene est clairement observe aux figures II.3 a II.6. Les figures II.7 et II.8 montrent la 
simulation de 1’ indice OCI, combinaison des UA et PA. 

Concernant les indices globaux et du fait de la difference d’effectifs entre A (50) et D (150), 
nous observons clairement l’orientation de « l’Average Accuracy » vers le « rappel » et 
l’orientation de « 1’ Average Precision » vers la « precision » (figures II.9 et II. 10). 

L’OA, le Kappa, la FI mesure et le OACI presente une forme symetrique, ils ne sont done pas 
orientes (figures II. 11 a 11.14). Des effets de bords sont observables sur les indices FI et Kappa. 
Les simulations des indices OA et AOCI sont similaires, l’AOCI etant cependant plus severe, 
indice plus faible, lorsque l’un des deux effectifs hors-diagonal est proche de 0. 

Les simulations des Kappa location et Kappa quantity parlent d’elles-memes (figure 11.15 et 
figure 11.16) et illustrent l’instabilite de ces indices. Par exemple, lorsque l’effectif en C est 
proche de 0 et l’effectif en B proche de 300, les deux indices sont tres instables avec des valeurs 
comprises entre -2.10 A 5 et 3.10 A 5. 
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Chapitre II : L’ evaluation de la classification 



3. devaluation de classification a partir de valeurs radiometriques spectrales et 
temporelles de reference 

Lorsque qu’il n’est pas possible de comparer une classification a un jeu de donnees spatiales de 
validation, la notion de matrice de confusion disparait. Sans possibility de comparaison spatiale, 
il faut alors faire une comparaison spectrale et temporelle afin de verifier que la classe obtenue 
en sortie de la classification est similaire a la classe d’apprentissage. Cette comparaison est 
aussi utilisee pour 1’ interpretation des classifications non-supervisees a partir de series 
temporelles et spectrales de valeurs radiometriques. 

3.1. Indice de similitude 

Dans le Chapitre I, nous avons introduit la notion de distance qu’il convient maintenant 
d’adapter pour obtenir un indice de similitude entre classe de reference et classe attribute par 
la classification. Voyons maintenant comment transformer ces distances en indices de 
similitude. 

Ind simi (Ci, Cj) = e _d(Ci ’ c ) ) (11.20) 

Les distances utilisees sont celles qui permettent de comparer deux ensembles. Parmi celles 
introduites au chapitre I, seule la distance de Bhattacharyya et la divergence de Kullbach- 
Leibler peuvent convenir. Nous avons conclu au chapitre I que la distance Bhattacharyya etait 
cede a utiliser en priorite. 

3.2. Matrice de similitude 

Le principe est identique aux matrices de confusion presentees dans les paragraphes 2.1 et 2.2 
avec la nouvelle definition de chaque element de la matrice tel que : 

m Ci , C j I n d S i m i(Ci, Cj) (11.21) 

3.3. Evaluation d’une matrice de similitude 

L’ evaluation d’une matrice de similitude se fait de la meme maniere qu’une matrice de 
confusion classique. 

Un exemple de matrice de similitude est presente en annexe 1.3. Les applications du chapitre 
V utiliseront les indices extraits de la matrice de similitude pour la validation de la methode. 
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4 : Applications 



4. Applications 

4. 1 . Comparaison des classifieurs sur des donnees de teledetection 

La premiere application se focalisera sur la comparaison des methodes de classification 
presentees dans le chapitre 1 a l’aide d’images Formosat-2 pour l’annee 2009 (voir annexe 1.3 
pour rappel des caracteristiques, des dates et des classes utilisees). Notons que nous comparons 
les indices pour des applications utilisant un grand nombre d’images, une definition precise des 
classes et un nombre important d’echantillons de verification. 

Les methodes utilisees sont rappelees dans le tableau II.2. Plusieurs logiciels ont ete utilises 
dont Envi 5.0, Orfeo Tool Box (OTB) et ceux developpes et ameliores durant ma these 
(CESBIO). 

Parmi les methodes ponctuelles, le maximum de vraisemblance (MV) est le classifieur le plus 
performant que ce soit par classe (16 fois meilleur sur 28 classes pour 1’OCI) ou d’un point de 
vu global (4 fois sur 6). Viennent ensuite les classifieurs par Reseaux Neuronaux (NN) et 
Support Vector Machines (SVM) avec noyau polynomial (tableaux II.3 et II.4). Ces resultats 
vont dans le sens d’etudes faites precedemment sur l’interet du Maximum de Vraisemblance 
pour la classification d’un grand nombre de classes et dont le nombre d’echantillons par classe 
est suffisamment important pour assurer leur significativite (Ducrot, 2005). 

La methode globale ICM est la plus performante grace a la consideration spatiale du processus 
de classification. Ses indices globaux sont en moyenne 5% plus eleves que ceux de la methode 
du Maximum de Vraisemblance (tableau II.3) et meilleurs pour 24 des 28 classes pour l’indice 
OCI. Les seules classes dont la performance est plus faible pour la methode ICM sont les classes 
d’eau (Eau, Lac, Gravieres) et la classe de Bati/Surface minerale (tableau II.4). Cette baisse de 
performance s’explique par l’utilisation du contexte par la methode ICM sur de petites classes 
sensibles aux problemes de decalage entre images prises a des dates differentes. 

Nous noterons egalement la faible performance de la classification objet. L’explication de cette 
faible performance est assez simple et provient du choix du seuil d’homogeneite lors de la 
definition des objets par la methode des bassins versants. Le seuil choisi peut ne pas convenir 
a certaines classes. 

Au vu des differences observees entre les differents classifieurs, il parait interessant de 
combiner les informations de chacun des classifieurs afin d’obtenir un resultat optimal, 
notamment entre methodes parametriques et non parametriques. Cette fusion d’information sera 
1’ objet du Chapitre IV. 
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Chapitre II : L’ evaluation de la classification 



Methode 


Parametrique 


Consideration 

spatiale 


Logiciel 


Parallelepipede 


Non 


Ponctuelle 


Envi 


Minimum distance euclidienne 


Non 


Ponctuelle 


Envi/Cesbio 


Minimum distance Mahalanobis 


Non 


Ponctuelle 


Envi/Cesbio 


Maximum de Vraisemblance (MV) 


Oui 


Ponctuelle 


Envi/Cesbio 


Reseaux neuronaux (NN) 


Non 


Ponctuelle 


Envi 


SVM a noyau Lineaire 


Non 


Ponctuelle 


OTB 


SVM a noyau Polynomial 


Non 


Ponctuelle 


OTB 


Iterated Conditional Mode (ICM) 


Oui 


Contextuelle 


Cesbio 


Objet Bhattacharyya 


Non 


Objet 


Cesbio 



tableau II. 2: Recapitulatif des methodes presentees au chapitre 1. 



Methode de classification 


AA 


AP 


OA 


Kappa 


AOCI 


FI 

mesure 


Parallelepipede 


20,16 


NaN 


13,97 


0,10 


9,31 


NaN 


Minimum Distance Euclidienne 


50,51 


33,89 


28,75 


0,25 


24,16 


0,41 


Minimum Distance Mahalanobis 


70,78 


57,76 


67,82 


0,65 


44,14 


0,64 


Maximum de Vraisemblance 


89,48 


85,42 


83,87 


0,82 


76,14 


0,87 


Reseaux neuronaux 


65,90 


NaN 


86,23 


0,85 


56,55 


NaN 


SVM a noyau Lineaire 


86,76 


71,42 


80,76 


0,79 


62,87 


0,78 


SVM a noyau Polynomial 


88,83 


74,23 


82,93 


0,81 


66,47 


0,81 


Iterated Conditional Mode 


94.04 


90.91 


91.36 


0.91 


85.60 


0.92 


Objet Bhattacharyya 


51,82 


48,46 


38,33 


0,35 


26,39 


0,50 



tableau II. 3 : Comparaison des criteres d'e valuation globaux pour chacune des methodes introduites pour les 
donnees Formosat-2 de 2009. Les valeurs sont indiquees en pourcentage (sauf pour le Kappa et FI). 
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4 : Applications 



OCI de la classe 
(en %) 


Parallelepipede 


Minimum Distance Eucddienne 


Minimum Distance Mahalanobis 


Maximum de Vraisemblance 


Reseaux neuronaux 


SVM a noyau Lineaire 


SVM a noyau Polynomial 


ICM 


Objet Bhattacharyya 


bad dense 


0,73 


6,78 


9,35 


84,55 


0,00 


41,15 


58,41 


87,05 


0,62 


bati/surf minerale 


95,06 


72,20 


78,42 


93,92 


0,00 


82,71 


86,63 


90,65 


1,96 


bad diffus 


0,08 


0,16 


1,27 


22,08 


0,02 


10,68 


9,03 


43,10 


10,35 


ble dur 


1,24 


21,28 


37,10 


61,34 


70,15 


50,93 


60,09 


84,36 


23,83 


ble tendre 


1,62 


0,00 


22,45 


50,65 


72,39 


51,35 


55,17 


82,83 


13,47 


chanvre 


0,05 


9,35 


42,98 


94,25 


86,30 


58,21 


76,17 


97,93 


23,77 


colza 


12,70 


0,00 


83,50 


88,91 


91,74 


88,07 


84,75 


95,71 


22,13 


eau libre 


0,00 


98,31 


95,76 


99,30 


89,53 


99,48 


99,55 


97,73 


87,84 


eucalyptus 


0,00 


51,34 


39,60 


93,30 


64,92 


83,01 


82,19 


96,80 


41,60 


eucalyptus 2 


0,00 


8,59 


12,38 


90,56 


45,09 


69,89 


63,78 


96,31 


12,76 


feuillus 


86,09 


78,32 


80,68 


95,24 


91,72 


92,45 


94,39 


95,75 


70,95 


friche 


0,00 


10,30 


20,37 


27,32 


30,95 


39,54 


46,79 


50,33 


1,74 


gravieres 


0,00 


97,75 


97,83 


99,72 


95,45 


99,11 


98,33 


99,52 


78,77 


jachere/surface gel 


0,46 


4,80 


30,37 


43,17 


48,57 


42,30 


48,27 


57,26 


1,10 


lac 


0,48 


96,81 


97,20 


99,92 


94,76 


99,96 


99,37 


99,90 


47,61 


mais 


0,08 


32,58 


82,27 


96,44 


94,22 


92,02 


89,95 


98,15 


70,29 


mais ensilage 


16,61 


7,45 


69,30 


92,75 


77,17 


78,50 


71,41 


93,66 


23,26 


mais non irrigue 


0,08 


0,00 


2,38 


92,33 


0,00 


10,32 


7,57 


93,04 


1,02 


orge 


0,00 


0,00 


33,42 


68,43 


71,17 


50,11 


48,56 


83,86 


6,12 


peupliers 


0,00 


19,20 


45,69 


92,98 


71,29 


79,61 


82,28 


96,24 


44,95 


pois 


0,84 


0,00 


0,77 


61,69 


4,71 


25,06 


38,22 


94,25 


4,42 


prairie temporaire 


0,01 


0,00 


24,28 


53,60 


50,93 


38,96 


49,28 


61,82 


0,29 


prairie permanente 


0,00 


0,00 


20,19 


37,85 


30,56 


29,27 


44,50 


48,74 


13,67 


resineux 


0,00 


42,42 


36,06 


95,78 


68,37 


86,42 


89,80 


96,99 


56,29 


soja 


6,66 


0,00 


50,51 


91,91 


72,21 


80,67 


85,01 


97,84 


48,85 


sorgho 


8,59 


14,12 


34,92 


54,20 


71,35 


57,57 


59,13 


80,36 


4,97 


surface minerale 


15,84 


5,29 


18,59 


60,04 


0,00 


37,03 


46,02 


83,66 


15,74 


tournesol 


13,50 


0,01 


69,09 


86,64 


91,23 


81,64 


85,06 


93,03 


10,54 



tableau II.4 : Comparaison des valeurs de l'indice OCI (en %) en fonction des differentes methodes presentees et 
des classes presentes pour les donnees Formo sat-2 annee 2009 
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Chapitre II : L’evaluation de la classification 



Des applications similaires de comparaisons de classifieurs ont ete faites sur les donnees Spot- 
2/4/5 de l’annee 2007 (annexe 1.4) ainsi que pour les donnees Landsat-5 de l’annee 2010 
(annexe 1.5). Nous ne presenterons ici que les indices globaux, nous reviendrons sur les details 
de ces applications au Chapitre IV pour la fusion des resultats de classification. 

Le tableau II.5 presente les performances des resultats de classification obtenus a partir des 
differents classifieurs pour les donnees Spot- 2/4/5 de l’annee 2007 et le tableau II.6 celles des 
resultats de classification obtenus a partir des differents classifieurs pour les donnees Landsat 
5 de l’annee 2010. 

Les resultats sont similaires a ceux observes au tableau II. 3, la methode du maximum de 
vraisemblance est la plus performante des methodes ponctuelles et la methode ICM offre les 
meilleurs resultats. 



Methode de classification 


AA 


AP 


OA 


Kappa 


AOCI 


FI 

mesure 


Parallelepipede 


7,35 


NaN 


4,81 


0,03 


3,66 


NaN 


Minimum Distance Euclidienne 


63,13 


49,29 


53,59 


0,49 


34,36 


0,55 


Minimum Distance Mahalanobis 


71,64 


57,22 


67,09 


0,63 


42,32 


0,64 


Maximum de Vraisemblance 


83,43 


81,03 


81,75 


0,79 


69,38 


0,82 


Reseaux neuronaux 


47,94 


NaN 


68,48 


0,63 


36,15 


NaN 


SVM a noyau Lineaire 


74,16 


58,45 


64,74 


0,61 


45,43 


0,65 


SVM a noyau Polynomial 


73,16 


58,62 


66,39 


0,62 


45,59 


0,65 


Iterated Conditional Mode 


84.84 


81.74 


82.91 


0.81 


70.67 


0.83 


Objet Bhattacharyya 


45,19 


49,58 


35,51 


0,31 


22,60 


0,47 



tableau II.5 : Comparaison des criteres d'evaluation globaux pour chacune des methodes introduites pour les 
donnees Spot 2/4/5 annee 2007. Les valeurs sont indiquees en pourcentage (sauf pour le Kappa et FI). 



Methode de classification 


AA 


AP 


OA 


Kappa 


AOCI 


FI 

mesure 


Parallelepipede 


13,09 


NaN 


29,11 


0,22 


3,43 


NaN 


Minimum Distance Euclidienne 


41,56 


23,86 


45,27 


0,41 


10,01 


0,30 


Minimum Distance Mahalanobis 


48,10 


27,57 


51,23 


0,47 


13,18 


0,35 


Maximum de Vraisemblance 


68,81 


43,61 


66,69 


0,63 


30,41 


0,53 


Reseaux neuronaux 


22,06 


NaN 


68,84 


0,65 


12,98 


NaN 


SVM a noyau Lineaire 


56,52 


32,99 


58,46 


0,54 


18,88 


0,42 


SVM a noyau Polynomial 


59,53 


35,09 


59,83 


0,56 


21,07 


0,44 


Iterated Conditional Mode 


75.09 


54.03 


70.50 


0.67 


41.25 


0.63 


Obj et B hattachary y a 


48,22 


29,79 


39,60 


0,35 


13,49 


0,37 



tableau II.6 : Comparaison des criteres d'evaluation globaux pour chacune des methodes introduites pour les 
donnees Landsat-5 de 2010. Les valeurs sont indiquees en pourcentage (sauf pour le Kappa et FI). 
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4 : Applications 



4.2. Comparaison des matrice de confusion avec et sans ponderation de probabilite 

Reprenons l’application des donnees Formosat-2 de l’annee 2009 utilisee precedemment et 
comparons les matrices de confusion avec et sans ponderation de probabilite. 

Le calcul de cette matrice de confusion avec ponderation par probabilite ne peut se faire que 
dans le cas d’une classification supervisee parametrique. Nous avons choisi ici de reprendre 
l’exemple du paragraphe 4.1 pour le Maximum de Vraisemblance. Les matrices de confusion 
avec et sans ponderation par les probabilites d’appartenance sont presentees en annexe 1.3, le 
resume de ces matrices par le biais des indices de performance extraits des matrices sont 
presentes ci-apres (figure 11.17 et figure 11.18). 

L’ajout de l’information de probabilite, en plus de V information d’imprecision contenue dans 
la matrice de confusion classique, permet de reajuster les resultats. D’un point de vue global, 
les resultats sont en moyenne 2% superieurs pour la matrice de confusion avec probabilites 
(figure II. 17) ce qui signifie que les elements de la diagonale (les biens classes) ont une certitude 
plus forte que les elements hors de la diagonales (les mal-classes). 

La figure II. 1 8 nous montre la difference de valeur de 1’ indice OCI entre la matrice de confusion 
classique et la matrice de confusion avec probabilites. Les conclusions sont identiques a celles 
du paragraphe precedent. Cependant deux classes sortent du lot : la classe de surface minerale 
et le bati dense. Dans le cas de la classe de surface minerale, l’indice OCI est plus eleve avec la 
ponderation de probabilite ce qui suggere une certitude lors du choix du classifieur alors que, 
pour la classe de bati dense, l’effet est inverse. 

Pour conclure sur cette comparaison entre les deux types de matrices de confusion, il est 
important de retenir que la matrice avec ponderation de probabilite permet de mettre en exergue 
des classes qui sont par definition sujettes a confusion (signatures spectrales et temporelles 
proches de cedes d’autres classes). Cette nouvelle matrice permet done d’ameliorer la mesure 
de la confusion pour l’utilisation d’un classifieur parametrique. 
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Chapitre II : L’ evaluation de la classification 




figure 11.17 : Comparaison des indices globaux avec et sans la ponderation par probability 



bati dense 



tournesol___4 ba t i/surf... 




figure 11.18 : Comparaison des valeurs de l’indice OCI entre la matrice de confusion classique et la matrice de 

confusion avec probability . 
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5. Conclusion 

L’objectif de ce chapitre etait d’introduire des indices de performance permettant de synthetiser 
1’ information d’une matrice de confusion de maniere unique afin de limiter les criteres 
d’ optimisation qui seront utilises dans les chapitres 3 et 4. Cet objectif est rempli par 
1’ introduction de deux nouveaux indices : l’OCI et l’AOCI. 

Le premier permet 1’ evaluation de la performance d’une classe par rapport aux autres en tenant 
compte des notions de precision et de rappel. Le second est une extension du premier et mesure 
la performance globale de la classification. 

Nous disposons desormais d’indices multi-caracteristiques pouvant servir de criteres 
d’ optimisation pour des algorithmes de selection et d’optimisation. 

Le second objectif concemait l’integration de la probability d’appartenance au calcul de la 
confusion entre les classes. Cette ponderation a permis de mieux mesurer la confusion avec 
l’ajout de la similitude de classe, c'est-a-dire la correspondance spectrale et temporelle entre 
classes de reference et classes issues de la classification. 
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Chapitre III. La selection automatique de donnees de 
grande dimension pour la classification 



Resume : Devant la grande quantite d’images de teledetection aujourd’hui disponible, il est 
utile de pouvoir selectionner les donnees d’ entree de la classification, quelle que soit leur 
nature : temporelle, spectrale ou type de fonction discriminante. Ce chapitre visera done a 
introduire un systeme de selection base sur le principe des Algorithmes Genetiques et les 
criteres de recherche introduit au chapitre 2, dans le but de maximiser la performance de la 
classification. 



Mots cles : selection, recherche sequentielle, algorithmes genetiques, grande dimension, 
systeme de Selection-Classification-Fusion. 



K 






« C’est la selection des details et non pas leur nombre qui 
donne a un portrait sa res semblance » 



Alexis Carrel, 1999. 
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Chapitre III : La selection automatique de donnees de grande dimension pour la classification 
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1 : Introduction de la selection de donnees pour la classification 



1 . Introduction de la selection de donnees pour la classification 

II a ete montre que la classification d’un grand nombre d’images multi-temporelles foumit une 
performance globale elevee de la classification mais pas necessairement la meilleure 
performance pour chaque classe (Ducrot, Masse, Marais-Sicre, & Dejoux, 2010; Ducrot, 
Sassier, Mombo, Goze, & Planes, 1998). 

Plusieurs explications peuvent etre donnees a ce phenomene. Premierement, la redondance 
d’informations peut causer des problemes de convergence lors de la classification (par exemple 
des dates de prise de vue tres proches) (Benediktsson, Sveinsson, & Amason, 1995; Hughes, 
1968). Deuxiemement, un nombre important d’images prises a des dates differentes impliquera 
des erreurs d’ortho-rectification et de correction, ce qui peut provoquer des decalages jusqu’a 
plusieurs pixels dans certaines conditions et d’ou 1’ introduction d’erreurs lors de la 
classification. La qualite de la classification de classes a geometrie fine, tel que les routes ou 
les haies, peut alors etre degradee par l’utilisation de l’ensemble de ces donnees. 
Troisiemement, certaines classes ont des signatures spectrales identiques a certaines dates 
(culture et sol nu en hiver par exemple) ce qui peut nuire a la discrimination des classes par 
l’algorithme de classification. 

L’idee developpee dans ce chapitre sera done de selectionner automatiquement la meilleure 
collection d’images foumie en entree du processus de classification. Cette operation aura pour 
but de maximiser a la fois la performance globale de la classification ainsi que la performance 
de chaque classe a l’aide des indices introduits au chapitre 2. 

Je presenterai, dans un premier temps, les divers algorithmes de selection existants et leurs 
applications a la teledetection. J’introduirai ensuite une nouvelle methode de selection basee 
sur la methode des Algorithmes Genetiques (paragraphe 2) et appliquee au probleme de la 
selection de donnees pour la classification d’images de teledetection (paragraphe 3). Une 
extension originale du probleme de selection sera ensuite detaillee au paragraphe 4 afin de 
pouvoir selectionner plus de caracteristiques (type de classifieur par exemple). Enfin, je 
presenterai le systeme automatique de classification dont la premiere partie utilise le nouvel 
algorithme de selection et qui sera nomme processus de Selection-Classification-Fusion 
(paragraphe 5). 

2. Les algorithmes de selection 

Le probleme de la recherche performante pour la selection de caracteristiques a ete 
intensivement investigue dans la litterature en reconnaissance de forme (Fukunaga, 1990; Jain 
& Zongker, 1997; Kittler, 1978) et plusieurs strategies optimales et sous-optimales y ont ete 
introduites. Dash (Dash & Liu, 1997) nous propose une hierarchisation interessante des 
methodes de selection. L’ensemble des methodes de selection y est separe en trois parties : les 
methodes optimales, sous-optimales et aleatoires (figure III. 1). 

La premiere famille de methode de selection regroupe les methodes dites optimales ou 
completes. Cette famille est elle-meme composee de 2 sous-familles, les methodes optimales 
exhaustives et les methodes optimales non exhaustives. 
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figure III. 1 : Hierarchisation des methodes de selection 



Les methodes optimales exhaustives parcourent l’ensemble de l’univers des possibility D (D 
etant le nombre de dates disponibles par exemple) qui est exprime par 2 #D . On notera que ces 
methodes ne sont pas utilisables pour #D grand (Fukunaga, 1990; Jain & Zongker, 1997). 

Les methodes optimales non exhaustives permettent de pallier a ce probleme de dimension de 
recherche. Nous citerons notamment la methode du « Branch & Bound » (Fukunaga, 1990; 
Narendra & Fukunaga, 1977) ainsi que la methode du « Best first » (Pearl, 1984) et sa version 
amelioree « Beam-Search » (Reddy, 1976). 

La seconde famille regroupe les methodes dites sous-optimales, id est qui ne convergent pas 
forcement vers la solution globale mais vers une solution approchee. Ces methodes ont 
l’avantage d’etre rapides et simples a manipuler. Steams (Steams, 1976) introduit la methode 
du inclusion de 1 - exclusion de r » ou (1, research. 

Les deux cas particuliers issus de cette methode sont la methode de recherche en avant et son 
homologue, la methode de recherche en arriere, appelees respectivement Sequential Forward 
Selection (SFS ou (l,0)-search) et Sequential Backward Selection (SBS ou (0,l)-search). 

L’ inconvenient majeur de ces methodes reside dans le choix statique des parametres 
d’exploration 1 et r. Pour pallier a ce probleme, les methodes Sequential Floating Forward 
Selection (SFFS) et Sequential Floating Backward Selection (SFBS) ont ete introduites et 
permettent 1’ introduction de parametres d’inclusion et d’exclusion dynamiques (Ferri, Pudil, 
Hatef, & Kittler, 1994; Pudil, Novovicova, & Kittler, 1994). Nous verrons dans la suite du 
chapitre les details de ces quatre methodes. 

La troisieme et derniere famille pourrait etre consideree comme faisant partie des methodes 
dites sous-optimales mais dont le principe repose sur le parcours aleatoire de l’univers de 
recherche contrairement aux methodes Sequentielles presentees precedemment. On la nommera 
« aleatoire » afin de la distinguer des autres methodes presentees au paragraphe precedent. Cette 
famille peut elle aussi etre separee en deux sous-familles que nous nommerons ponderee et 
uniforme (non-ponderee). Les methodes aleatoires uni formes comprennent les algorithmes qui 
generent des sous-ensembles de recherche de maniere entierement aleatoire. Nous citerons les 
algorithmes Las Vegas Wrapper (LVW) et l’algorithme Rapid Gravity Survey Systems (RGSS) 
qui introduisent l’aleatoire dans les methodes SFS et SBS. La deuxieme sous-famille est 
egalement aleatoire, mais desormais chaque sous-ensemble est pondere suivant son importance, 
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ce qui necessite un indice de ponderation pour caracteriser cette importance. Les Algorithmes 
Genetiques (GA) (Goldberg, 1989; Holland, 1962) sont la methode la plus connue de cette sous 
famille. 

Dans le cadre de la selection de donnees de teledetection, nous citerons les travaux de Ferri et 
Serpico (Ferri et al., 1994; Serpico & Bruzzone, 2001) pour l’extraction de caracteristiques et 
les travaux de Pu (Bajcsy & Groves, 2004; Pu & Gong, 2000; X. Zhang & Niu, 2009) pour la 
selection de bandes hyper- spectrales. 

Parmi les algorithmes cites precedemment, nous utiliserons ceux de la famille sous-optimale 
sequentielle (SFS, SBS et leur amelioration SFFS et SFBS) et celui de la famille sous-optimale 
aleatoire ponderee (AG). Ces algorithmes sont les plus usites dans la litterature citee 
precedemment. 

2. 1 . Le probleme a resoudre 

Commengons par poser le probleme que nous souhaiterions resoudre : a partir d’un jeu temporel 
d’images, nous souhaiterions extraire automatiquement le meilleur sous-ensemble de donnees 
afin de maximiser une performance choisie de la classification. L’ equation III. 1 formalise ce 
probleme d’optimisation. 

D opt = arg max(performance de la classification des donnees Dj) (IH.l) 



Nous cherchons done le sous-ensemble d’images D opt parmi les dates disponibles D qui 
maximise la performance du processus de classification. 

Notons que cette recherche sera dependante du classifieur et des classes utilisees. Nous 
proposerons une extension du probleme pose en fin de chapitre afin d’y ajouter des 
caracteristiques a selectionner (bandes spectrales et classifieur, paragraphe 4). 

2.2. Les methodes SFS et SBS 

Le SBS et SFS sont des methodes de selection sous optimale mais tres rapide, leur complexite 
de calcul est estimee a 0((#D) 2 ) (Jain & Zongker, 1997; Kittler, 1978). Le principe est simple : 
l’algorithme est initialise soit a l’aide de l’ensemble entier (SBS) soit de l’ensemble vide (SFS). 
Puis, tant que le nouveau sous-ensemble choisi est plus performant que le precedent, on enleve 
un element de l’ensemble (SBS) ou en ajoute un (SFS) (Roli & Fumera, 2001). Le risque 
d’obtenir un maximum local non global est tres important avec cette methode car il n’y a pas 
de procedure de retour en arriere. 

Les methodes SFS et SBS sont en realite des cas particuliers de l’algorithme (1, research 
introduit par Steams (Stearns, 1976). Cet algorithme est aussi appele « inclusion de 1 - exclusion 
de r » et consiste a ajouter (inclusion) et retirer (exclusion) a chaque iteration un nombre fixe 
de dates. Le choix arbitraire de ces deux parametres 1 et r sont le plus gros facteur limitant de 
cette methode. Nous verrons par la suite des methodes derivees de celle-ci avec un choix 
dynamique pour 1 et r. 
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Ecrivons l’algorithme general du (hr)-search 

Entree : D = {dj tq Vi 6 [1, #D]} 

Initialisation : Si l>r Alors k :=0 ;D opt = D prec := 0 

Sinon k :=#D ; D opt = D prec := D 

Tant que ((performance(D opt ) > performance(D prec )et(k > 0)et(k < #D)) 
D prec = D opt 
Etape 1 : Inclusion 

Repeter 1 fois 

d + := arg^ max pt performance (D U {d}) 

D o P t = D opt U {d + } ; k=k+l; 

Fin Repeter 
Etape 2 : Exclusion 
Repeter r fois 

d _ := arg^nmx^ performance (D\{d}) 

D o P t = D opt u{d + };k=k-l; 

Fin Repeter 

Fin Tant que 
Sortie : D opt 



2.3. Les methodes SFFS et SFBS 

Pour pallier aux limitations evoquees precedemment pour les methodes SFS et SBS, de 
nouvelles methodes derivees de celles-ci ont ete developpees (Pudil et al., 1994) et permettent 
de choisir dynamiquement le sens et l’intensite de deplacement de l’algorithme dans l’univers 
de recherche. 

Ecrivons l’algorithme du SFFS 

Entree : D = {d, tq Vi G [1, #D]} 

Initialisation : k :=0 ;D opt = D prec := 0 

Tant que ((k > 0)et(k < #D)) 

Etape 1 : Inclusion 
D prec = D opt 

d + := ar g d max pt performance(D U {d}) 

D o P t = D opt u{d + };k=k+l; 

Etape 2 : Exclusion conditionnelle 

d _ := arg^max t performance(D\{d}) 

Si (performance(D opt \{d _ }m) > performance(D prec ) 

Alors D opt = D opt \{d - }; k=k-l; 

Retour Etape 2 
Sinon Retour Etape 1 
Fin 

Sortie : D opt 



L’algorithme du SBFS s’ecrit facilement par interversion de l’inclusion et de l’exclusion ainsi 
que de la condition de depart de l’algorithme precedent. 
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2.4. La methode des Algorithmes Genetiques 

La methode des Algorithmes Genetiques (AG) est une methode sous optimale, aleatoire et 



(Dawkins & Sigaud, 1989). La methode remonte a 1962 avec les premiers travaux de Holland 
sur les systemes adaptatifs (Holland, 1962). Mais il faut attendre 1989 et le livre de David 
Goldberg pour obtenir la forme definitive et complete de cette methode telle que nous 
l’utiliserons ici (Goldberg, 1989). 

La methode repose sur la definition des cinq elements suivants (Alliot & Durand, 2005) : 

Le codage de chaque individu. Ce codage permet de modeliser chaque individu comme 
ensemble de caracteristiques qu’il conviendra de selectionner. Dans notre cas, un 
individu sera compose des dates a utiliser (et plus tard de bandes spectrales et d’un 
classifieur, paragraphe 4.1). Le codage est pour le moment considere comme binaire. 
Initialisation de la population d’individus. Cette initialisation se fait de maniere 
aleatoire. 

Une fonction permettant de selectionner les meilleurs individus appelee « fitness 
measure » qui permet de juger de la performance de chaque individu. 

Des operateurs genetiques permettant de faire varier les individus et done d’explorer 
l’univers de recherche au cours des generations. 

Des parametres de dimensionnement : la taille de la population, le critere d’ arret, les 
probability des differents operateurs genetiques. 

Nous voyons immediatement que cette methode permet de modeliser intuitivement le probleme 
de recherche de meilleures dates pour la classification. Le point negatif sera de determiner les 
bons parametres afin d’ameliorer la vitesse de convergence de la methode. 

Redefinissons les termes constituant les AG dans le cadre de notre probleme de selection de 
dates. 

Definition : Un individu de la population (ou « chromosome » en genetique) sera note Dj ter et 
definira les dates utilisees par l’individu i a la generation iter. 

Notation : Le codage d’un individu se fera de la maniere suivante : 



ponderee. La partie aleatoire permet l’exploration et empeche l’arret sur des maxima locaux 
tandis que la ponderation permet d’accelerer la vitesse de convergence de 1’algorithme en 
favorisant les meilleurs individus. 



Le principe des Algorithmes Genetiques est derive de la genetique et de 1’ evolution naturelle 



P late d G D- ter 




(III.2) 
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Dans l’exemple suivant, D| ter est compose des images aux dates 3, 5 et 6. La notation sera done 
la suivante : 



Dj ter = {IM 3 , IM 5 , IM 6 } ; (IH.3) 

D g r = 1 ; Dg r = 0 (in.4) 



Durant chaque generation, quatre operations sont appliquees par les AG : la mutation, le 
croisement, la selection et enfin la reproduction (figure III.2). Decrivons chacune de ces quatre 
operations. 

La premiere operation est la mutation (figure III.3). Cette operation permet d’operer une 
permutation intra-individu sur les dates. Elle est definie de la maniere suivante pour la mutation 
de la date d mut pour l’individu D- ter : 



mutation(D| ter , d mut ) 




= 1 - D 



iter 

i,d 




si d — d mut 
sinon 



(III.5) 



Le choix de d mut se fait par tirage aleatoire. La mutation est 1’ operation la plus importante des 
AG car elle permet l’exploration de l’univers de recherche et empeche ainsi la convergence 
vers un maximum local. 

La seconde operation est le croisement qui permet d’effectuer une permutation entre deux 
individus (figure III.4). Cet echange inter-individu peut s’appliquer sur plusieurs elements a la 
fois. Cette operation est definie de la maniere suivante pour deux individus i et j et un ensemble 
D cr ° is d e dates a permuter : 

( ni ter = ni ter si d e n crois 

!; !; (in.6) 

D fd r = D u r sinon 

Une probability d’ occurrence est appliquee sur les deux operations precedentes et notee 
respectivement Pmutation Pcroisement- 

Les troisieme et quatrieme operations consistent a evaluer les individus et a les reproduire pour 
la generation suivante, suivant le score de leur evaluation. 

Dans le cadre d’une application supervisee, nous utiliserons les indices de performance extraits 
de la matrice de confusion comme fonction d’ evaluation. Cette matrice de confusion est obtenue 
apres classification des donnees multidimensionnelles de 1’ ensemble D- ter . La performance est 
notee performance(D| ter ). 
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figure III. 2 : Schema d’execution des Algorithmes Genetiques 



Date a muter : cW 

i 

Jeuxde donnees D a 
I' iteration i 

Mutation j 






Jeuxde donnees D a 
I'iteration i+1 



figure III. 3 : Illustration du principe de mutation 



Ensemble Dcrois de 
, dates a intervertir , 

Ml \ MImI | Ml 

MM I II I I J 

I I 

- . I I 

Croisement ■ j 



Jeuxde donnees Di a 
^iteration iter 

Jeuxde donnees Dj a 
l # iteration iter 



Ml Ml T 



Jeuxde donnees Di a 
r iteration iter+1 



i 



i 



figure III. 4 : Illustration du principe de croisement entre deux individus 
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La reproduction se fait a partir de la performance de chaque individu. Meilleur sera l’individu, 
plus grande sera sa presence a la generation suivante. Le choix le plus frequent pour la fonction 
de reproduction est la suivante : 



piter+1 



Dj ter ,V 



e 



performance(D- ter ) x nbjndividus 
1 Sk=i individus performance (D^ 61- ) 



(HI.7) 



Ce type de reproduction permet de conserver les meilleurs individus sans leur donner 
d’omnipresence, ce qui pourrait causer la convergence precoce vers un maximum local. 



Ecrivons Ealgorithme des Algorithmes Genetiques : 

Entree : D = (dj tq Vi 6 [1, #D]} 

Initialisation : Tous les individus sont initialises aleatoirement 

Tant que (si critere_arret faux) 

Pour chaque individu i 

Etape 1 : Mutation 

Dj — ^mutation x mutation^Dj , d mu j;) 

avec X mutation ~ Bernouilli(l, p mut ation)< d mut tire aleatoirement 
Etape 2 : Croisement 

Dj ter = X croisemen t x croisement(D| ter , Dj ter , D crois ) 



avec X croisemen t~ Bernouilli(l, p cr oisement)> D crois tire aleatoirement 
Etape 3 et 4 : Evaluation et Reproduction 



piter+1 



= Dj ter Vj 6 



performance^D| ter ^xnb_individus 
1 ' 2^ ndividus performance(D^ ter ) 



Fin Pour 

D opt = argmax performance ( D^) 

k 

Si (performance(D lter ) — performance(D lter_1 ) < s alors critere_arret = 1 

Fin Tant que 
Sortie: D opt 



3. Applications des methodes de selection de donnees 

Nous appliquerons les cinq methodes detaillees precedemment aux applications suivantes : 

- selection temporelle sur les donnees Formosat-2 annee 2009 (16 dates, annexe 1.3). 

- selection temporelle sur les donnees Spot-2/4/5 annee 2007 (6 dates, annexe 1.4). 



70 



te I- 0 0 9 2 1 8 5 3 , v e r s io n 



3 : Applications des methodes de selection de donnees 



3.1. Application selection temporelle sur Formosat-2 annee 2009 

Rappelons que nous disposons de 16 dates acquises par le satellite Formosat-2 pour l’annee 
2009 sur la zone Sud-Ouest de Toulouse et que ces 16 dates ont ete geo-referencees, ortho- 
rectifiees et corrigees d’effets atmospheriques, ce qui rend la comparaison temporelle possible. 
La liste des classes est disponible en annexe 1.3. 

Parmi ces 16 dates, nous disposons de 3 dates de Mars, 3 dates de Juillet et 4 dates d’Aout, ce 
qui peut impliquer de la redondance d’ information pour certaines classes (voir histogramme 
des dates utilisees en annexe 1.3). 

Appliquons les methodes de selection presentees aux paragraphes precedents pour le probleme 
de la selection du meilleur jeu temporel d’images. Le tableau III. 1 regroupe les parametres 
utilises par la methode de selection par Algorithmes Genetiques. Pour les cinq methodes, la 
methode de classification utilisee lors de l’etape devaluation est 1’algorithme ICM. 

La comparaison des resultats de selection des meilleures dates est presentee au tableau III. 2. 
D’un point de vue global, les quatre methodes sequentielles (SFS, SBS, SFFS et SBFS) 
obtiennent des resultats similaires. Les Algorithmes Genetiques fournissent des resultats 
identiques voire superieurs. 

Le tableau III. 3 fournit des details supplementaires sur la nature des jeux de donnees 
selectionnes par la methode AG. D’un point de vue general, les jeux de donnees possedent un 
nombre eleve de dates (entre 8 et 16 sur les 16 dates disponibles) mais ne possedent que tres 
rarement l’ensemble des 16 dates. 

En matiere de convergence et de temps d’execution (figure III.6), l’avantage revient aux 
methodes dites Backward car les meilleurs jeux de donnees sont souvent ceux qui disposent du 
plus grand nombre de dates. Les AG convergent eux aussi rapidement vers leur optimum (entre 
2 et 6 generations suivant les cas de figures). 

Les figures III. 6 a III. 8 illustrent parfaitement le genre de probleme que la selection de donnees 
permet de corriger. Nous presentons ici l’exemple de la classe « Tournesol », qui est tres 
largement surclassee dans l’extrait de la classification obtenue a partir du meilleur jeu de 
donnees en termes de performance globale (figure III.7). Lorsque l’on selectionne ce jeu de 
donnees en fonction de l’indice de performance de la classe « Tournesol », la surrepresentation 
de cette classe disparait (figure III.8). Cette amelioration s’explique par l’absence d’une date 
de mars dans le nouveau jeu de donnees (tableau 0.3). Rappelons qu’au mois de mars, la 
culture du Tournesol n’a pas encore commence, et que le champ est en sol nu (figure 0.6). 

En conclusion, les AG semblent etre un bon compromis entre rapidite et convergence optimale 
meme si l’avantage de la rapidite revient a la methode SBFS. 
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Parametres AG 


Valeur 


P_mutation 


1/100 


P_croisement 


6/10 


Taille de la population 


50 


Nombre de generations maximum 


10 


Critere evaluation 


AOCI ou OCI 



tableau III. 1 : Parametres utilises pour la methode des Algorithmes Genetiques 



Methodes 


Valeur 

optimale 

AOCI 


Valeur optimale 
OCI 

classe Feuillus 


Valeur optimale 
OCI 

classe Ble dur 


Valeur optimale 
OCI 

classe Tournesol 


Valeur optimale 
OCI 

classe Eau libre 


SFS 


85,60 


95,23 


84,36 


93,03 


98,28 


SBS 


85,60 


95,24 


84,36 


92,11 


99,37 


SFFS 


85,60 


95,24 


84,01 


93,03 


97,11 


SBFS 


85,60 


95,24 


84,36 


92,03 


97,11 


AG 


85,60 


95,75 


84,36 


93,03 


99,73 



tableau III. 2 : Comparaison des methodes de selection par evaluation de leur performance respective (en %) 





Global 


Classe 

Feuillus 


Classe 
Ble dur 


Classe 

Tournesol 


Classe 
Eau libre 


Performance 


85,60 


95,75 


84,36 


93,03 


99,73 


Jeu de donnees 


16 dates 


13 dates 


15 dates 


15 dates 


8 dates 


Fevrier 


15 


15 


15 


15 




Mars 


17; 21; 30 


21; 30 


17; 21 


17; 21 




Mai 


3 


3 


3 


3 


3 


Juin 


23 


23 


23 


23 




Juillet 


1; 12; 26 


1; 12; 26 


1; 12; 26 


1; 12; 26 


12; 26 


Aout 


5; 14; 22; 30 


22; 30 ! 


5; 14; 22; 30 


5; 14; 22; 30 


5; 22; 30 


Septembre 


6; 24 


6; 24 


6; 24 


6; 24 


6; 24 


Octobre 


16 


16 


16 


16 





tableau III. 3 : Extrait de performance et details des dates des meilleurs jeux de donnees selectionnes par TAG 




-*-SBS 

-*-SFS 

-*-SBFS 

-*-SFFS 

^i^AG 



figure III.5 : Temps d’execution des methodes de selection pour la recherche du jeu de donnees Formosat-2 qui 

maximise la performance globale (AOCI). 
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figure III. 6 : Extrait Google Map ® representant la realite de la scene 




figure III.7 : Extrait de la classification du jeu de figure III. 8 : Extrait de la classification du jeu de 

donnees selectionne pour la meilleure performance donnees selectionne pour la meilleure performance 
globale de la classe Tournesol 





Ble 




Orge 


■ 


1 Jachere 


■ 


Tournesol 


u 


Colza 


■ 


Boi.s 




Praiiie 


■ 





l 



Mais 

Eau 



Bati/surface 

minerale 



figure III.9 : Legende 
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3.2. Application selection temporelle sur Spot 2/4/5 annee 2007 



Rappelons que nous disposons de 6 dates acquises par les satellites Spot pour 1’ annee 2007 sur 
la zone Sud-Ouest de Toulouse. Elies ont ete geo-referencees, ortho-rectifiees et corrigees 
d’effets atmospheriques, ce qui rend la comparaison temporelle possible. La liste des classes 
est disponible en annexe 1 .4. 

Notons ici que les differences de vitesse de convergence des differentes methodes sont 
comparables a celle obtenue avec l’application Formosat-2 (figure III. 10). 

Le tableau III.4 foumit les details sur la selection des meilleurs jeux de donnees par la methode 
des Algorithmes Genetiques. Ces resultats de selection sont logiques et similaires a ceux qu’un 
expert aurait pu effectuer manuellement. Par exemple, pour les classes de cultures, la selection 
a ete faite en choisissant les dates suivant leur stade phenologique, done discriminantes. 





Global 


Classe 

Feuillus 


Classe 
Ble dur 


Classe 

Tournesol 


Classe 
Eau libre 


Performance 


70,67 


96,53 


58,87 


88,61 


96,9 


Jeu de donnees 


6 dates 


5 dates 


5 dates 


4 dates 


5 dates 


Jours du mois de : 
Fevrier 


15 


15 


15 


15 


15 


Avril 


8 


8 


8 




8 


Juin 


20 


20 


20 




20 


Juillet 


25 


25 


25 


25 




Septembre 


15 


15 




15 


15 


Novembre 


16 




16 


16 


16 



tableau III.4 : Extrait de performance et details des meilleurs jeux de donnees selectionnes par TAG 




— SBS 
— SFS 
— *— SBFS 
— SFFS 
— AG 



figure III. 10 : Temps d’execution des methodes de selection pour la recherche du jeu de donnees Spot qui 

maximise la performance globale (AOCI) 
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4. Extension du probleme de selection 

En plus de la selection temporelle, nous pouvons ajouter une selection sur les canaux spectraux, 
sur le classifieur utilise ou sur toute information a priori pouvant etre incorporee a une methode 
de classification. 

Les methodes presentees de type Sequentiel (SBS, SFS, SBFS et SFFS) ne peuvent fonctionner 
qu’avec des elements a selectionner dont les etats sont binaires. Or le choix du classifieur n’est 
plus binaire s’il y en a plus de deux parmi lesquels choisir. Pour utiliser ces methodes, il faudrait 
alors decomposer ce nombre en base 2, ce qui aurait pour consequence 1’ augmentation 
importante des caracteristiques a choisir. La flexibility des AG permet d’utiliser une 
formulation plus flexible. 

4. 1 . Adaptation de la methode des AG 

Commengons par reecrire le probleme a resoudre : 

{IM opt , classifieur opt } 

(ITT 8T 

= argmax(performance classification IMj avec classifieurj) 

Le nouveau probleme revient ainsi a rechercher les meilleures images dans l’espace IM suivant 
les dimensions temporelles et spectrales, au sens de la performance de la classification de ces 
donnees et du meilleur classifieur choisi parmi les methodes disponibles et applicables. 

Voyons maintenant les modifications a apporter a la formulation des Algorithmes Genetiques 
presentes au paragraphe 2.4 afin de resoudre le nouveau probleme de l’equation III. 8. 

Les changements se situent au niveau du processus de mutation et de croisement et notamment 
pour la nouvelle caracteristique du choix de classifieur. Ce choix, contrairement aux autres 
caracteristiques, n’est pas binaire et necessite done une modification des processus de mutation 
(equation III.9) et de croisement (equation III. 10). 

mutation({lM- ter , classifieur- ter }, element mut ) 




si element mut — {d mut , 

kmut} 



sinon 



classifieur- ter = choix aleatoire parmi 
l'ensemble des classifieurs possibles 
prive de classifieur| ter 



si element™,^ = classifieur 



mut 



^classifieurj ter = classifieur. !ter 



sinon 



(HI- 9) 





sinon 



(III. 10) 



si elementrrnjo = classifieur. 



crois 



a_croiser 



^classifieurj ter = classifieurj ter sinon 
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Chapitre III : La selection automatique de donnees de grande dimension pour la classification 



4.2. Applications du probleme complet 

Reprenons les applications precedentes en incluant maintenant la selection des canaux et du 
classifieur, et uniquement avec la methode de selection par Algorithmes Genetiques. 

Pour des questions de complexity de codage, seuls cinq classifieurs ont ete integres dans les 
applications qui suivent : methode de minimisation de distance de Manhattan, euclidienne, de 
Tchebychev, de Mahalanobis et methode ICM. 

4.2.1. Applications aux donnees Formosat-2 annee 2009 

Le tableau III. 5 montre quelques resultats de la selection de donnees spectrales, temporelles et 
du classifieur, appliquee aux donnees Formosat-2 annee 2009 disposant de 64 plans temporels 
et spectraux. Le jeu de donnees qui obtient la meilleure performance globale dispose de 63 
canaux sur 64 et utilise la methode ICM. Prenons l’exemple de la classe « Eau libre » dont le 
meilleur jeu de donnees contient moins de canaux « proche infrarouge », ce qui s’explique par 
le fait que cette classe n’a, par definition, que peu de confusion avec des classes de vegetation, 
qui sont tres absorbantes dans cette longueur d’onde. L’algorithme ICM est tres souvent choisi, 
sauf pour les classes d’eau et de bati. 

4.2.2. Applications aux donnees Spot 2/4/5 annee 2007 

Le tableau III. 6 montre quelques resultats de la selection de donnees spectrales, temporelles et 
du classifieur, appliquee aux donnees Spot-2/4/5 annee 2007 disposant de 19 plans temporels 
et spectraux. Le jeu de donnees qui obtient la meilleure performance globale dispose de 18 
canaux sur 19 et utilise la methode ICM. Prenons l’exemple de la classe « Tournesol » dont le 
meilleur jeu de donnees ne contient que peu de canaux « proche infrarouge », canal n’apportant 
pas d’information de dissociation entre cultures proches. L’algorithme ICM est tres souvent 
utilise, sauf pour les classes d’eau et de bati. 

4.2.3. Applications aux donnees Landsat-5 annee 2010 

L’ application liee a l’utilisation des donnees Landsat est tres interessante car elle dispose d’une 
richesse de classes tres importante (79 classes, voir annexe 1.5) avec des classes de culture mais 
surtout de vegetation naturelle. 

Le tableau III. 7 montre quelques resultats de la selection de donnees spectrales, temporelles et 
du classifieur, appliquee aux donnees Landsat-5 annee 2010 disposant de 15 plans temporels et 
spectraux (annexe 1.5). Le jeu de donnees qui obtient la meilleure performance globale dispose 
de 15 canaux sur 15 et utilise la methode ICM. Prenons l’exemple de la classe « Feuillus » dont 
le meilleur jeu de donnees ne contient que peu de canaux de la date de Juillet. 
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Global 


Feuillus 


Tournesol 


Eau libre 


Indice AOCI 


83,64 


95,45 


92,44 


o 

o 


Nombre de plans 


63 sur 64 


54 sur 64 


56 sur 64 


60 sur 64 


Dates / canaux 


B 


V 


R 


PIR 


B 


V 


R 


PIR 


B 


V 


R 


PIR 


B 


V 


R 


PIR 


15 Fevrier 


X 


X 


X 


X 


X 


X 




X 


X 


X 


X 


X 


X 


X 


X 


X 


17 Mars 


X 


X 


X 


X 


X 


X 


X 


X 




X 


X 


X 


X 


X 


X 




21 Mars 


X 


X 


X 


X 


X 


X 




X 


X 


X 




X 


X 


X 


X 


X 


30 Mars 


X 


X 


X 


X 


X 


X 




X 


X 


X 


X 


X 


X 


X 


X 


X 


3 Mai 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


23 Juin 


X 


X 


X 


X 


X 


X 




X 


X 


X 


X 




X 




X 




1 Juillet 


X 


X 


X 


X 


X 


X 


X 


X 




X 


X 




X 


X 


X 


X 


12 Juillet 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


26 Juillet 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


5 Aout 


X 


X 


X 


X 




X 




X 


X 


X 


X 




X 


X 


X 




14 Aout 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 




X 


X 


X 


X 


X 


22 Aout 


X 


X 


X 


X 


X 




X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


30 Aout 


X 




X 


X 


X 


X 




X 




X 


X 


X 


X 


X 


X 


X 


6 Septembre 


X 


X 


X 


X 


X 


X 






X 


X 


X 


X 


X 


X 


X 


X 


24 Septembre 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


16 Octobre 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


X 


Classifieur 


ICM 


ICM 


ICM 


Min dist Eucl 



tableau III.5 : Extraits des resultats de la selection de donnees Formosat-2 annee 2009 



Global 



Ble dur 



Tournesol 



Eau libre 



Indice AOCI 



77,55 



96,96 



60,75 



97,89 



Nombre de plans 



18 sur 19 



16 sur 19 



13 sur 19 



13 sur 19 



Dates / canaux 



V R PIR 



MIR 
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ICM 



ICM 



ICM 



Min Dist Eucl 



tableau III. 6 : Extraits des resultats de la selection de donnees Spot 2/5/5 annee 2007, ND pour canal non 

disponible 





Global 


Classe Feuillus 


Classe Tournesol 


Indice AOCI 
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95,17 


Nombre de plans 
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Dates / canaux 
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X X X X X 

X X X X X 


X X 

X X X X X 

X X X X X 


X X X X X 

XXX X 

XXX X 


Classifieur 


ICM 


ICM 


ICM 



tableau III. 7 : Extraits des resultats de la selection de donnees Landsat-5 annee 2010 
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Chapitre III : La selection automatique de donnees de grande dimension pour la classification 



5. Introduction du systeme de Selection-Classification-Fusion 

Dans le cadre de l’automatisation et de 1’ amelioration des processus de classification 
supervisee, j’ai introduit un nouveau systeme de Selection-Classification-Fusion (SCF) (Masse, 
Ducrot, & Marthon, 2011) decompose en trois parties distinctes : la selection des donnees, la 
classification et la fusion des resultats (figure III. 11). En appliquant la nouvelle methode de 
selection de donnees presentee au paragraphe 4, le but est d’obtenir de maniere automatique les 
meilleures images et le meilleur classifieur en fonction d’un critere unique, une optimisation 
multicriteres etant difficile a resoudre pour un nombre de classes important et un univers de 
recherche de grande dimension. 




figure III.l 1 : Schema illustratif de la methode de Selection-Classification-Fusion (SCF) 

Nous reviendrons plus en detail sur la partie fusion du processus au cours du chapitre suivant, 
mais pour le moment considerons qu’un tel algorithme existe et permette de fusionner plusieurs 
resultats de classification de maniere automatique et optimale (partie verte de la figure III.l 1). 

Le but du systeme SCF est done de decomposer un systeme d’optimisation multicriteres qui 
consisterait a trouver la classification qui maximise la performance globale et la performance 
de chaque classe, en plusieurs processus paralleles d’optimisation monocritere. Ces operations 
independantes ameliorent la rapidite de calcul pour les etapes de selection et de classification. 
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6 : Conclusion 



6. Conclusion 

L’objectif de ce chapitre etait de developper une methode permettant la selection automatique 
d’un jeu de donnees d’entree d’un processus de classification supervisee, afin de maximiser le 
critere de performance choisi parmi ceux introduits au chapitre 2. 

Parmi les methodes presentees, la methode des Algorithmes Genetiques s’est montree la plus 
flexible et la plus performante. Cette methode permet la selection automatique des donnees 
temporelles, spectrales et du choix du classifieur a appliquer. 

Cette methode a ete validee sur plusieurs applications differentes et comparee a d’autres 
approches generalement utilisees en teledetection et selection de caracteristiques. Les resultats 
de selection presentes sont logiques et similaires a ceux qu’un expert aurait pu effectuer 
manuellement. Rappelons l’exemple des classes de cultures ou la selection correspond aux 
choix des dates des stades phenologiques. La methode pourra etre utilisee dans le cadre du 
systeme automatique d’ amelioration du resultat de classification appele Selection- 
Classification-Fusion. 
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Chapitre IV. La fusion d’ images issues de 

classifications supervisees 



Resume : Les donnees de teledetection sont de plus en plus variees et abondantes : images 
optiques et radar, basse, haute, tres haute resolution, multi-spectrales, images derivees (images 
texturales, images masques) et donnees exogenes (Modeles Numeriques de Terrain, donnees 
physiques). Afin d’utiliser cette diversite d’information pour la classification, j’introduirais une 
methode originale de fusion de resultats de classification. Cette methode se voudra automatique, 
performante et robuste afin d’utiliser au mieux la diversite et la complementarite des donnees 
multidimensionnelles pour la classification. Les applications porteront principalement sur la 
fusion optique/radar, multi-temporelle et multi-classifieur. Ces applications se serviront des 
meilleurs jeux de donnees selectionnes au chapitre precedent. 



Mots cles : fusion resultat classification, confusion, applications optique/radar, multi- 
classifieurs, multi-temporelles 



\ 




A 




«Aucun modele generique n’existe pour tous les 
problemes et aucune technique n’est applicable a tous les 
problemes. Cependant, nous disposons d’un ensemble 
varie d’outils performants pour un ensemble tout aussi 
varie de problemes a resoudre» 






Kanal, 1974 




a 
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Chapitre IV : La fusion d’images issues de classifications supervisees 
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1 : Introduction 



1. Introduction 

Grace a devolution des techniques d’acquisition, les donnees de teledetection contiennent de 
plus en plus d’ informations. Pour bien comprendre l’interet fondamental de la fusion de 
donnees, rappelons la diversite des donnees utilisees en traitement d’ images de teledetection : 
images optiques et radar, basse, haute, tres haute resolution, multi-spectrales, images derivees 
(images texturales, images masques) et donnees exogenes (Modeles Numeriques de Terrain, 
donnees physiques). 

L’objectif de ce chapitre est d’introduire une methode de fusion de donnees automatique, 
performante et robuste afin d’utiliser au mieux la diversite et la complementarite des donnees 
multidimensionnelles pour la classification. 

Commengons par introduire la notion de fusion. Bloch et Maitre (Bloch, 2005; Bloch & Maitre, 
2002) definissent la fusion comme etant la combinaison d’ images heterogenes pour aider le 
processus de decision. Une autre definition plus generate est fournie par Wald (Wald, 1999), 
qui decrit la fusion de donnees comme etant une structure formelle qui regroupe les moyens et 
outils pour bunion des donnees d’une meme scene, mais provenant de sources differentes. Nous 
retrouvons la meme notion d’heterogeneite et de complementarite. 

Chaque source de donnees foumit une part d’information imparfaite au sens incertain, imprecis, 
incomplet, contradictoire voire non performant (Smets, 1999). Une methode efficace de fusion 
sera celle qui utilisera la complementarite de chaque caracteristique d’une donnee (dans notre 
cas temporelle, spectrale,...) afin d’en extraire le meilleur de chacune et d’obtenir un resultat 
unique. On dit que deux sources d’information sont complementaires lorsque leur performance 
differe en fonction des conditions d’observation et de la nature des proprietes observees. Plus 
les donnees sont complementaires, meilleur est le resultat de leur fusion. 

J’introduirai dans un premier temps les differentes methodes de fusion existantes, qu’elles 
soient a priori, pendant ou a posteriori du processus de classification (paragraphe 2). Je 
presenterai alors une nouvelle methode de fusion de resultats de classification (paragraphe 3). 
Cette methode s’executera a posteriori du processus de classification et possede de nombreux 
avantages par rapport aux methodes de fusion existantes. Cette methode fera partie integrante 
du processus automatique de Selection-Classification-Fusion presente au chapitre precedent 
(paragraphe 4). Enfin au paragraphe 5, nous verrons un large panel d’ applications pour valider 
l’utilisation de la nouvelle methode de fusion presentee avec notamment des fusions 
optique/radar, multi-classifieurs et multi-temporelles. 

2. La fusion de donnees 

En traitement d’images de teledetection, la fusion peut se decomposer en trois categories : la 
fusion de donnees a priori, la fusion de decisions de classifieurs et la fusion de resultats de 
classifications a posteriori, que nous allons detailler dans la suite de ce chapitre. La difference 
fondamentale entre ces differentes categories se situe dans la position du processus de fusion 
au sein de la chaine de traitement (figures IV. 1 a IV.3). 
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Chapitre IV : La fusion d’images issues de classifications supervisees 




figure IV. 1 : Illustration du fonctionnement de la fusion de donnees a priori 




figure IV. 2 : Illustration du fonctionnement de la fusion de decisions 

La fusion induisant une comparability des donnees a traiter, sa position est importante et peut 
ne pas etre compatible avec toutes les applications. Nous verrons par la suite que la categorie 
qui offre le plus de souplesse, i.e. dont les hypotheses sont les moins contraignantes, regroupe 
les methodes de fusion de resultats de classification a posteriori. 

2.1. La fusion de donnees a priori 

Le premier ensemble regroupe les methodes de fusion de donnees a priori. Ces methodes 
consistent a fusionner plusieurs images avant le processus de classification (figure IV. 1). 

Sans entrer dans le detail des methodes, nous citerons differents travaux concernant le 
developpement et l’application de methodes de fusion de donnees. Pour la fusion de donnees 
multi sources, nous citerons les travaux de (Agostinelli, Dambra, Serpico, & Vemazza, 1991; 
Solberg, Jain, & Taxt, 1994). Pour la fusion de donnees multi resolutions, nous citerons par 
exemple les travaux de Chavez et ceux de Numez sur la combinaison d’images 
panchromatiques haute resolution avec des images multi spectrales basse resolution (Chavez, 
Sides, & Anderson, 1991; Nunez et al., 1999). Enfin, pour la fusion de donnees multi 
temporelles, nous citerons les travaux sur les approches simplifies avec classification en 
cascade de Swain (Swain, 1978) et ceux de Kalayeh sur l’utilisation du contexte de la 
correlation inter pixel (Kalayeh & Landgrebe, 1986). 

2.2. La fusion de decisions de classification 

Le second ensemble de methodes regroupe les methodes de fusion de decision de classifieur au 
cours du processus de classification. La fusion de decision foumit une decision finale sur la 
decision du choix de la classe a attribuer au pixel par combinaison des decisions obtenues sur 
chaque donnee (figure IV. 2). Ces methodes sont tres utilisees pour les classifications SVM qui 
necessitent de telles methodes pour une utilisation multi-classes (Chapitre I, paragraphe 
2. 1 .4.1). 
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2 : La fusion de donnees 




figure IV. 3 : Illustration du fonctionnement de la fusion de resultats de classification 



Nous citerons ensuite les methodes basees sur la theorie des possibility (Dubois & Prade, 1988, 
1993; L. A. Zadeh, 1965; L. A. Zadeh, Anvari, Bloch, & Beasse, 1998; Lotfi A. Zadeh, 1968) 
et la logique floue (Tupin, Bloch, & Maitre, 1999; Wang, Hall, & Subaryono, 1990). 

Enfin, nous citerons les methodes basees sur la theorie de E evidence introduite par Dempster- 
Shafer (DST) (Dempster, 1960; Shafer, 1976) et qui sont largement utilisees aujourd’hui dans 
le domaine du traitement d’image (Bloch, 1996; Foucher, Germain, Boucher, & Benie, 2002; 
Le Hegarat-Mascle, Bloch, & Vidal-Madjar, 1998) mais aussi dans le domaine du traitement 
du signal (X. Zhang & Niu, 2009). Plus recemment, la theorie de Dezert-Smarandache (DSmT) 
(Smarandache, 1991; Smarandache & Dezert, 2006) et son amelioration avec integration des 
informations contextuelles (Elhassouny, Idbraim, Bekkari, Mammass, & Ducrot, 2012) ont ete 
introduites et permettent une amelioration des performances de la DST. 

Nous citerons les applications de ces methodes pour la fusion de donnees multi-sources (Chair 
& Varshney, 1986; Reibman & Nolte, 1987) et T etude comparative des methodes de fusion de 
Laanaya (Laanaya, Martin, Aboutajdine, & Khenchaf, 2008). Ces etudes ont permis de montrer 
deux limitations importantes des methodes de fusion de decisions : 

Premierement, ces methodes necessitent d’avoir des classifieurs et des fonctions de 
decisions comparables, ce qui n’est pas le cas, par exemple, pour la fusion de decisions 
de classifieurs parametriques pour des donnees optique et radar. 

- Deuxiemement, lorsque le nombre de classes devient important, les processus de 
fusions deviennent complexes. Dans le cadre de la theorie DSmT, Elhassouny montre 
qu’a partir de 6 classes, la complexity de calcul devient trop importante (Elhassouny et 
al„ 2012). 

2.3. La fusion de resultats a posteriori 

Un resume interessant des methodes de fusions de resultats de classification, aussi appele fusion 
d’images de classifications, est propose par Kuncheva (Kuncheva, Bezdek, & Duin, 2001). 
Cette famille de methodes de fusion a posteriori regroupe les methodes de fusions par vote 
majoritaire (Ramasso, Valet, & Teyssier, 2005) et les methodes de fusion bayesienne « nai'ves ». 
Nous citerons egalement les applications sur la fusion multi-classifieurs (Kittler, Hatef, Duin, 
& Matas, 1998) et multi-sources (Briem, Benediktsson, & Sveinsson, 2002). Le fonctionnement 
de ces methodes de fusion de resultats a posteriori est illustre en figure IV. 3. 

Ces methodes presentent d’emblee Tavantage evident d’une normalisation de toutes les 
donnees a fusionner car les produits utilises sont des images classees avec une structure de 
classes identique. 
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Chapitre IV : La fusion d’images issues de classifications supervisees 



3. La fusion d’images de classification supervisees 

Je presenterai ici trois methodes de fusion d’images de classification supervisees. Les deux 
premieres seront basees sur un choix par vote majoritaire et la troisieme sera une methode 
originale consistant a minimiser la confusion du produit final. Commen§ons par definir 
certaines notations. 

Notations : Nous notons CLA l’ensemble des images resultantes de classification et cla un 
element de cet ensemble, performance^ la performance globale de la classification cla et 
performance_classe da la performance de la classification cla pour la classe c de l’ensemble 
des classes C. 

3.1. Methode de fusion par vote majoritaire 

Le premier algorithme utilise pour la fusion d’images issues de classification est la methode la 
plus simple : pour chaque pixel, on lui attribue la classe qui apparait le plus souvent dans les 
images classees foumies en entree. 

Algorithme de la methode de fusion par vote majoritaire : 

Entree : CLA : ensemble des images issues de diverses classifications 

C : l’ensemble des classes a considerer 
Pour chaque pixel s 

Cg = argmax(#{cla s == c tq cla G CLA}) 

ceC 

Fin pour 



3.2. Methode de fusion par vote majoritaire pondere 

Le second algorithme est base sur le principe du premier mais avec l’ajout un systeme de 
ponderation de 1’ information. La classe finale ne sera plus attribute a la classe majoritaire mais 
a la classe possedant la somme des scores de performance maximale. Chaque classification aura 
comme poids sa performance globale. 

Algorithme de la methode de fusion par vote majoritaire pondere : 

Entree : CLA : ensemble des images cla issues de diverses classifications 

C : l’ensemble des classes a considerer 
performance c i a : la performance de la classification cla 
Pour chaque pixel s 

Cg = argmax(#{cla s == s, cla E CLA} x £ clas==c performance cla ) 

cEC S 

Fin pour 
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3 : La fusion d’ images de classification supervisees 



3.3. Methode de fusion par minimisation de confusion 

Nous allons desormais aj outer une restriction supplementaire : la performance de chaque classe. 
Le principe est le suivant : nous determinons une classification de reference (la meilleure en 
matiere de performance globale) et pour chaque classe, une classification de reference pour 
cette classe (en matiere de performance de la classe). Chaque pixel O de la classification de 
reference est ensuite compare au pixel P de la classification de reference pour la classe trouvee 
en O (figure IV.4). Parmi ces deux classes trouvees, on selectionne celle qui minimisera la 
confusion finale. 



Image classee de reference globale Image classee de reference pour la classe cf lob 





Pixel O : classe c! 



glob 




Pixel P : classe cf lass 



Image classee finale 



figure IV.4 : Illustration de l’etape 2 de l’algorithme de fusion par minimisation de confusion 

Cette methode applique done une restriction de l’espace des possibility d’attribution de la 
classe finale car contrairement aux methodes precedentes qui utilisent #CLA possibility {id est 
le nombre d’images donne en entree de la methode), la nouvelle methode restreint l’univers des 
possibilites a 2 elements. 

L’algorithme sera done decompose en deux parties. La premiere consistera a determiner les 
images de reference suivant #C + 1 criteres : la reference qui maximisera la performance globale 
et pour chaque classe une reference qui maximise la performance de la classe. La seconde 
consistera a parcourir l’image et a comparer les elements de reference en fonction des classes 
observees, et a choisir celle qui minimisera les confusions de l’image finale (et done en 
maximisera la performance). 

L’algorithme est presente ci-apres et schematise a la figure IV.5. Le principe de la methode est 
le suivant : on parcourt l’image classee de reference qui maximise la performance globale. La 
classe ainsi trouvee est comparee a celle de 1’ image classee qui maximise la performance de 
cette classe. Si les classes observees sont identiques, cette classe est conservee. Sinon, on choisit 
celle qui minimise la confusion du resultat final en comparant les matrices de confusion des 
deux references. 
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Chapitre IV : La fusion d’images issues de classifications supervisees 



Algorithme de la methode de fusion par minimisation de confusion 

Entree : CLA : ensemble des images cla issues de diverses classifications 

M : ensemble des matrices de confusions m associees a CLA 
C : 1’ ensemble des classes a considerer 
performance c i a : la performance de la classification cla 
performance_classe£ la : la performance de la classification cla pour la classe 

c 

Etape l.a : Extraction de la meilleure classification au sens performance globale 
cla ref - globale = argmax performance^ 

cla 

Etape l.b : Extraction des meilleures classifications au sens performance de chaque classe 
Pour chaque classe c e C 

cla ref - classec = argmax performance_classe^ a 

cla 

Fin Pour 

Etape 2 : Parcours de 1’ image et attribution de la classe (figure IV.4) 

Pour chaque pixel s 
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3 : La fusion d’ images de classification supervisees 




figure IV. 5 : Illustration de la methode de fusion par minimisation de confusion 
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Chapitre IV : La fusion d’images issues de classifications supervisees 



4. Application au processus de Selection-Classification-Fusion 

A partir des jeux de donnees selectionnes par les algorithmes du chapitre 3, nous appliquons 
maintenant le processus de fusion par minimisation de confusion afin de combiner les resultats 
des classifications de ces jeux (figure IV. 6, partie verte). 




figure IV.6 : Illustration du processus de Selection-Classification-Fusion 

Notons que ce processus, excepte la prise d’echantillons, est automatique et permet d’obtenir 
un resultat optimal. Notons egalement sa structure parallele qui lui permet des executions 
rapides sur des architectures multiprocesseurs. 

En resume, ce systeme permet d’ameliorer de maniere entierement automatique la performance 
de n’importe quelle classification d’un jeu de donnees multidimensionnelles et ceux sans 
surcout important du temps de calcul. 

La suite de l’application de ce systeme sera presentee au paragraphe 5.2. 
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5 : Applications des methodes de fusion a posteriori de resultats de classifications 



Criteres devaluation 
(en % sauf Kappa) 


Parallelepipede 


Minimum Distance 
Euclidienne 


Minimum Distance 
Mahalanobis 


Maximum de 
vraisemblance 


Reseaux neuronaux 


SVM a noyau lineaire 


SVM a noyau 
Polynomial 


Fusion vote 
majoritaire 


Fusion vote 
majoritaire pondere 


Fusion par 
minimisation de 
confusion 


AA 


20,16 


50,51 


70,78 


89,48 


65,90 


86,76 


88,83 


88,61 


91,32 


91,18 


AP 


NaN 


33,89 


57,76 


85,42 


NaN 


71,42 


74,23 


80,57 


82,07 


86,50 


OA 


13,97 


28,75 


67,82 


83,87 


86,23 


80,76 


82,93 


85,44 


87,84 


88,76 


Kappa 


0,10 


0,25 


0,65 


0,82 


0,85 


0,79 


0,81 


0,84 


0,87 


0.88 


AOCI 


9,31 


24,16 


44,14 


76,14 


56,55 


62,87 


66,47 


72,01 


75,33 


79,19 


FI mesure 


NaN 


0,41 


0,64 


0,87 


NaN 


0,78 


0,81 


0,84 


0,86 


0.89 



tableau IV. 1 : Comparaison des indices de performance globale en fonction des differents classifieurs utilises et 

de leur fusion pour 1’ application Formosat-2 annee 2009. 



5. Applications des methodes de fusion a posteriori de resultats de classifications 

5.1. La fusion de resultats de classifications obtenus a partir de differents classifieurs 

Nous avons observe au cours des chapitres I et II la complementarite des classifieurs ponctuels. 
Afin d’ exploiter cette complementarite, nous avons applique les methodes de fusion a 
posteriori introduites dans le paragraphe 3 sur les resultats de classifications du Chapitre II. 

Reprenons 1’ application des images Formosat-2 annee 2009 (rappel en annexe 1.3) et les 
classifications effectuees au chapitre 2 sur 1’evaluation des differents classifieurs ponctuels. Le 
Maximum de Vraisemblance l’emportait majoritairement sur tous les tableaux (tableaux IV. 1 
et IV.2) suivi de deux autres classifieurs (NN et SVM a noyau Polynomial). 

Comparons maintenant les trois methodes de fusion a posteriori introduites : vote majoritaire, 
vote majoritaire pondere et minimisation de confusion. 

La fusion des classifieurs a permis d’obtenir une image classee dont les indices de performance 
globale sont en moyenne 2,5% plus eleves (tableau IV. 1). Les resultats de la methode de fusion 
par minimisation de confusion sont proches de ceux de la methode par vote majoritaire pondere 
mais neanmoins superieur de 1%. La diversite des resultats est plus marquee concemant 1’ indice 
de performance par classe OCI (tableau IV.2). La methode par minimisation de confusion 
obtient des resultats proches voire superieurs a ceux des deux autres methodes. L’exemple de 
la classe « ble dur » est illustre aux figures IV.7 a IV. 13, seule la methode de fusion par 
minimisation de confusion a permis d’ameliorer la distinction entre « orge » et « ble dur ». 
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Chapitre IV : La fusion d’images issues de classifications supervisees 
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CD 

"O 

G 

O 



G 

Oh 

G 

.2 

"c/5 

G 

Gh 



bati dense 


0,73 


6,78 


9,35 


84,55 


0,00 


41,15 


58,41 


48,93 


60,48 


84,55 


bati/surf min. 


95,06 


72,20 


78,42 


93,92 


0,00 


82,71 


86,63 


90,47 


92,09 


93,92 


bati diffus 


0,08 


0,16 


1,27 


22,08 


0,02 


10,68 


9,03 


14,78 


19,29 


20,58 


ble dur 


1,24 


21,28 


37,10 


61,34 


70,15 


50,93 


60,09 


58,21 


66,61 


70,23 


ble tendre 


1,62 


0,00 


22,45 


50,65 


72,39 


51,35 


55,17 


49,25 


62,65 


72,36 


chanvre 


0,05 


9,35 


42,98 


94,25 


86,30 


58,21 


76,17 


80,93 


87,00 


93,99 


colza 


12,70 


0,00 


83,50 


88,91 


91,74 


88,07 


84,75 


92,03 


93,38 


91,42 


eau fibre 


0,00 


98,31 


95,76 


99,30 


89,53 


99,48 


99,55 


99,69 


99,67 


99,48 


eucalyptus 


0,00 


51,34 


39,60 


93,30 


64,92 


83,01 


82,19 


84,92 


90,81 


91,28 


eucalyptus 2 


0,00 


8,59 


12,38 


90,56 


45,09 


69,89 


63,78 


70,91 


78,13 


90,51 


feuillus 


86,09 


78,32 


80,68 


95,24 


91,72 


92,45 


94,39 


91,13 


94,19 


95,35 


friche 


0,00 


10,30 


20,37 


27,32 


30,95 


39,54 


46,79 


35,88 


42,97 


48,24 


gravieres 


0,00 


97,75 


97,83 


99,72 


95,45 


99,11 


98,33 


97,84 


99,95 


99,72 


jachere/gel 


0,46 


4,80 


30,37 


43,17 


48,57 


42,30 


48,27 


52,93 


55,77 


54,15 


lac 


0,48 


96,81 


97,20 


99,92 


94,76 


99,96 


99,37 


97,21 


100,0 


99,97 


mais 


0,08 


32,58 


82,27 


96,44 


94,22 


92,02 


89,95 


93,72 


95,94 


96,57 


mais ensilage 


16,61 


7,45 


69,30 


92,75 


77,17 


78,50 


71,41 


85,24 


88,45 


92,75 


mais non irrig. 


0,08 


0,00 


2,38 


92,33 


0,00 


10,32 


7,57 


15,97 


30,43 


92,33 


orge 


0,00 


0,00 


33,42 


68,43 


71,17 


50,11 


48,56 


62,34 


69,87 


69,65 


peupliers 


0,00 


19,20 


45,69 


92,98 


71,29 


79,61 


82,28 


76,85 


84,92 


92,54 


pois 


0,84 


0,00 


0,77 


61,69 


4,71 


25,06 


38,22 


34,56 


60,51 


56,04 


prairie temp. 


0,01 


0,00 


24,28 


53,60 


50,93 


38,96 


49,28 


51,89 


56,07 


55,56 


prairie perm. 


0,00 


0,00 


20,19 


37,85 


30,56 


29,27 


44,50 


39,19 


43,24 


38,77 


resineux 


0,00 


42,42 


36,06 


95,78 


68,37 


86,42 


89,80 


84,70 


91,12 


95,78 


soja 


6,66 


0,00 


50,51 


91,91 


72,21 


80,67 


85,01 


88,11 


91,21 


89,09 


sorgho 


8,59 


14,12 


34,92 


54,20 


71,35 


57,57 


59,13 


51,83 


62,57 


74,28 


surface min. 


15,84 


5,29 


18,59 


60,04 


0,00 


37,03 


46,02 


47,19 


49,59 


60,04 


tournesol 


13,50 


0,01 


69,09 


86,64 


91,23 


81,64 


85,06 


86,53 


88,57 


93,03 



tableau IV. 2 : Comparaison des valeurs de l’indice de performance par classe OCI, en fonction des differents 
classifieurs utilises et de leur fusion, suivant les 28 classes presentes pour l’application Formosat-2 annee 2009 
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5 : Applications des methodes de fusion a posteriori de resultats de classifications 




figure IV.7 : (a) Methode de classification MV figure IV. 8 : (b) Methode SVM polynomial (degre 2) 



figure IV. 9 : (c) Methode des reseaux de neurones 



figure IV. 10 : (d) Fusion par la methode de vote 
majoritaire 





figure IV. 1 1 : (e) Fusion par la methode de vote figure IV. 12 : (f) Fusion par la methode de 

majoritaire pondere minimisation de confusion 



Non classe 


ble tendre 


| sorgho 


_j prairie temporaire 


gravieres 


batti diffus 


| feuillus 


| colza 


| soja 


J2J eau I'bre 


peupliers 


| surface minerale 


| resineux 


| orge 


| pois 


| lac 


eucalyptus 2 


| mais ensilage 


eucalyptus 


| mais 


^3 jachere_surface gel bati dense 


^3 chanvre 


| mais non irrigue 


ble dur 


| tournesol 


| friche 


bati ind_surf minerale 


pre_prairie permanente 





figure IV. 13 : Donnees Formosat-2 annee 2009, extrait des resultats de methodes de classification (a), (b) et 
(c), et extrait des images de fusion des resultats obtenus a partir des differents classifieurs (d), (e) et (f). 
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Chapitre IV : La fusion d’images issues de classifications supervisees 



Criteres devaluation 
(en % sauf Kappa) 


Parallelepipede 


Minimum Distance 
Euclidienne 


Minimum Distance 
Mahalanobis 


Maximum de 
vraisemblance 


Reseaux neuronaux 


SVM a noyau lineaire 


SVM a noyau 
Polynomial 


Fusion vote 
majoritaire 


Fusion vote 
majoritaire pondere 


Fusion par 
minimisation de 

_ r : 


AA 


7,35 


63,13 


71,64 


83,43 


47,94 


74,16 


73,16 


82.09 


83.78 


84.83 


AP 


NaN 


49,29 


57,22 


81,03 


NaN 


58,45 


58,62 


69.75 


71.73 


81.77 


OA 


4,81 


53,59 


67,09 


81,75 


68,48 


64,74 


66,39 


77.11 


79.35 


81.76 


Kappa 


0,03 


0,49 


0,63 


0,79 


0,63 


0,61 


0,62 


0.74 


0.77 


0.79 


AOCI 


3,66 


34,36 


42,32 


69,38 


36,15 


45,43 


45,59 


58.61 


61.35 


70.67 


FI mesure 


NaN 


0,55 


0,64 


0,82 


NaN 


0,65 


0,65 


0.75 


0.77 


0.83 



tableau IV. 3 : Comparaison des indices de performance globale en fonction des differents classifieurs utilises et 

de leur fusion pour 1’ application Spot-2/4/5 annee 2007 
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AA 


13,09 


41,56 


48,10 


68,81 


22,06 


56,52 


59,53 


62,29 


68,05 


69,08 


AP 


NaN 


23,86 


27,57 


43,61 


NaN 


32,99 


35,09 


40,59 


42,06 


44,58 


OA 


29,11 


45,27 


51,23 


66,69 


68,84 


58,46 


59,83 


67,77 


68,75 


67,16 


Kappa 


0,22 


0,41 


0,47 


0,63 


0,65 


0,54 


0,56 


0,64 


0.65 


0,64 


AOCI 


3,43 


10,01 


13,18 


30,41 


12,98 


18,88 


21,07 


25,81 


28,87 
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FI mesure 


NaN 


0,30 


0,35 
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NaN 
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0,52 
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tableau IV.4 : Comparaison des indices de performance globale en fonction des differents classifieurs utilises et 

de leur fusion pour 1’ application Landsat-5 annee 2010 



Nous observons des resultats similaires dans le cadre des applications aux images Spot 2/4/5 de 
l’annee 2007 (annexe 1.4) et Landsat 5 de l’annee 2010 (annexe 1.5). Ces resultats sont 
respectivement resumes dans les tableaux IV.3 et IV.4. 
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5 : Applications des methodes de fusion a posteriori de resultats de classifications 



5.2. La fusion de classifications obtenues a partir de jeux de dates differents 

Dans le Chapitre III et dans le cadre du systeme de Selection-Classification-Fusion, plusieurs 
selections de donnees ont ete faites afin de maximiser la performance suivant plusieurs criteres : 
une classification qui maximise la performance globale et pour chaque classe, une classification 
qui maximise l’indice de performance de cette classe. 

Afin d’ exploiter cette complementarite, nous avons applique les methodes de fusion a 
posteriori introduites dans le paragraphe 3 sur ces applications de selection. 

5.2.1. L’application aux donnees Formosat-2 de l’annee 2009 

Dans le cadre du processus de Selection-Classification-Fusion, un jeu de donnees de reference 
globale et un jeu de donnees de reference pour chaque classe ont ete selectionnes. Leur fusion 
par methode de minimisation de confusion permet l’augmentation des indices globaux (en 
moyenne 1,5%, tableau IV.5) et pour chaque classe (en moyenne 3%, tableau IV. 6). Les 
methodes par vote majoritaire sont ici peu performantes du fait du grand nombre de donnees a 
fusionner (nombre de classes +1) et done de la redondance d’erreurs. La nouvelle methode est 
done plus robuste et performante que les methodes basees sur les votes majoritaires, meme 
ponderes. 

5.2.2. L’application aux donnees Spot-2/4/5 de l’annee 2007 

Le tableau IV.7 indique une nette amelioration des performances pour la methode de fusion par 
minimisation de confusion. Les conclusions concernant la robustesse et la performance de cette 
methode se confirment de nouveau pour cette application. 

5.2.3. L’application aux donnees Landsat-5 de l’annee 2010 

Les resultats obtenus avec les 3 images Landsat-5 sont tres interessants car ils nous montrent 
que meme avec peu de dates et un grand nombre de classes (79 classes, details en annexe 1.5), 
il est possible d’extraire des informations complementaires et ainsi ameliorer la performance 
finale (tableau IV.8). 

L’ amelioration des performances est tres faible mais neanmoins significative. Nous retrouvons 
le probleme de redondance d’erreurs pour les methodes de fusion par vote majoritaire. 
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Chapitre IV : La fusion d’images issues de classifications supervisees 



Criteres devaluation 
(en % sauf Kappa) 


Reference 

globale 


Fusion vote 
majoritaire 


Fusion vote 
majoritaire 
pondere 


Fusion par 
minimisation de 
confusion 


AA 


94,04 


93,88 


93,88 


94,40 


AP 


90,91 


90,09 


90,08 


91,48 


OA 


91,36 


90,91 


90,90 


92,36 


Kappa 


0,91 


0,90 


0,90 


0.92 


AOCI 


85,60 


84,74 


84,74 


86,52 


FI 


0,92 


0,92 


0,92 


0.93 



tableau IV. 5 : Comparaison des indices de performance globale de la reference globale et des fusions pour 

f application Formo sat-2 annee 2009 



OCI (en %) pour la 
classe 


Reference 

globale 


Reference 
pour la 
classe 


Fusion vote 
majoritaire 


Fusion vote 
majoritaire 
pondere 


Fusion par 
minimisation 
de confusion 


bati dense 


87,05 


87,05 


89,93 


89,93 


86,33 


bati/surf minerale 


90,65 


99,29 


92,81 


92,81 


92,09 


bati diffus 


43,10 


43,10 


42,67 


42,59 


43,77 


ble dur 


84,36 


84,36 


82,12 


82,13 


84,27 


ble tendre 


82,83 


82,83 


80,54 


80,53 


82,97 


chanvre 


97,93 


97,93 


96,40 


96,47 


97,13 


colza 


95,71 


95,71 


96,04 


96,03 


95,91 


eau libre 


97,73 


99,73 


97,73 


97,73 


97,82 


eucalyptus 


96,80 


96,80 


95,03 


95,09 


96,34 


eucalyptus 2 


96,31 


96,31 


95,85 


95,85 


97,20 


feuillus 


95,75 


95,75 


95,81 


95,79 


95,97 


friche 


50,33 


52,20 


50,04 


50,13 


56,97 


gravieres 


99,52 


99,98 


99,54 


99,54 


99,54 


jachere/surface gel 


57,26 


59,45 


56,79 


56,74 


63,25 


lac 


99,90 


100,00 


99,92 


99,92 


99,90 


mais 


98,15 


98,15 


97,63 


97,63 


98,25 


mais ensilage 


93,66 


95,23 


92,88 


92,86 


93,92 


mais non irrigue 


93,04 


93,04 


91,40 


91,40 


92,63 


orge 


83,86 


83,86 


83,19 


83,18 


83,27 


peupliers 


96,24 


96,24 


95,96 


95,96 


96,15 


pois 


94,25 


94,25 


90,32 


90,52 


94,25 


prairie temporaire 


61,82 


62,21 


60,58 


60,57 


65,80 


pre/prairie permanente 


48,74 


52,93 


48,70 


48,55 


54,87 


resineux 


96,99 


96,99 


96,05 


96,11 


97,32 


soja 


97,84 


97,84 


97,60 


97,59 


97,92 


sorgho 


80,36 


80,36 


77,17 


77,16 


82,51 


surface minerale 


83,66 


85,62 


77,51 


77,51 


82,82 


tournesol 


93,03 


93,03 


92,46 


92,45 


93.24 



tableau IV. 6 : Comparaison des valeurs de l’indice de performance par classe OCI de la reference globale et des 
references par classe et de leur fusion suivant les 28 classes presentes pour l’application Formosat-2 annee 2009 
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5 : Applications des methodes de fusion a posteriori de resultats de classifications 



Criteres devaluation 
(en % sauf Kappa) 


Reference 

globale 


Fusion vote 
majoritaire 


Fusion vote 
majoritaire 
pondere 


Fusion par 
minimisation de 
confusion 


AA 


84,84 


83,54 


83,51 


85,04 


AP 


81,74 


77,97 


77,96 


81,38 


OA 


81,75 


82,14 


82,13 


83,05 


Kappa 


0,79 


0,80 


0,80 


0.81 


AOCI 


70,67 


66,86 


66,83 


70,72 


FI 


0,83 


0,81 


0,81 


0.83 



tableau IV. 7 : Comparaison des indices de performance globale de la reference globale et des fusions pour 

l’application Spot 2/4/5 annee 2007 



Criteres devaluation 
(en % sauf Kappa) 


Reference 

globale 


Fusion vote 
majoritaire 


Fusion vote 
majoritaire 
pondere 


Fusion par 
minimisation de 
confusion 


AA 


75,09 


72,94 


74,26 


75,11 


AP 


54,03 


50,22 


51,35 


54,11 


OA 


70,50 


70,66 


70,91 


70,67 


Kappa 


0,67 


0,67 


0.68 


0,68 


AOCI 


41,25 


37,01 


38,42 


41,55 


FI 


0.63 


0,59 


0,61 


0.63 



tableau IV. 8 : Comparaison des indices de performance globale de la reference globale et des fusions pour 

l’application Landsat 5 annee 2010 
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Chapitre IV : La fusion d’images issues de classifications supervisees 



5.3. La fusion de classifications obtenues a partir de sources differentes 
5.3.1. La fusion de classifications de donnees Spot et Radarsat 

Dans le cadre d’un programme de recherche pour la promotion des donnees Radarsat 
(Application Developement and Research Opportinity, ADRO), l’objectif etait de definir un 
indicateur d’environnement pour evaluer la vulnerability du milieu naturel face a des pollutions 
engendrees par l’activite humaine. L’outil necessaire a cet objectif etait done l’etablissement 
d’une carte d’occupation des sols. 

Ces cartes d’occupation des sols ont ete etablies par le biais de plusieurs classifications a partir 
des donnees disponibles : 

- 4 images Radarsat, Single Look Complexe (SLC) en mode FI, prises aux dates du 28 

Juin 1997, 22 Juillet 1997, 08 Septembre 1997 et 19 Novembre 1997. 

1 image Spot en mode XS (multi-spectral, 3 bandes) du 13 Aout 1997. 

La zone d’etude se situe dans un bassin du Grand Morin (le Vannetin affluent du Grand Morin) 
en Seine et Marne (France) qui foumit en eau potable une partie de la region parisienne. Le site 
est essentiellement constitue de parcellaires agricoles, de bois et de forets. 

Nous pouvons exploiter la complementarite des donnees optiques et radar afin d’extraire une 
information plus riche, ce qui a permis une meilleure distinction des differentes classes. Seules 
les methodes de fusion a posteriori n’imposent pas d’hypothese sur la normalisation des 
donnees et la comparability des classifieurs. 

Le processus de fusion avec les images Radar non filtrees, classees avec la loi de Gauss Wishart 
(GW, loi contextuelle), ameliore les resultats de l’image SPOT (loi de Gauss) pour la majorite 
des classes : environ 2% en moyenne (tableau IV. 9). 

L’apport de la classification ne transparait que sur les classes « orge » et « urbain » (tableau 
IV. 10), neanmoins la complementarite des donnees permet d’obtenir d’autres ameliorations 
notamment pour la classe de ble tendre (+13%). 

Les figures IV. 14 a IV.21 presentent les differents resultats et donnees utilises lors de cette 
application. 

La visualisation de cette classification (figure IV. 20) montre les ameliorations pour la Foret, le 
Mals et le Pois. La confusion des pixels de contours des champs de mais avec l’herbe est reduite, 
ce qui ameliore les structures des champs. 
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5 : Applications des methodes de fusion a posteriori de resultats de classifications 



Criteres 
devaluation 
(en % sauf 
Kappa et FI) 


Classification 
donnees Spot 


Classification 

donnees 

RadarSat 


Fusion vote 
majoritaire 


Fusion vote 
majoritaire 
pondere 


Fusion par 
minimisation 
de confusion 


AA 




81,30 


72,54 


75,59 


80,96 


82,71 


AP 




84,45 


74,35 


84,58 


84,16 


86,09 


OA 




83,59 


77,32 


81,48 


83,13 


85,70 


Kappa 




0,81 


0,73 


0,78 


0,80 


0,83 


AOCI 


70,02 


55,73 


65,06 


69,56 


72,74 


FI 


0,83 


0,73 


0,80 


0,83 


0,84 


tableau IV.9 : 


Comparaison des indices des resultats de classification des donnees optique et radar et de leur 
fusion en fonction d’ indices de performance globaux. 


OCI (en %) 
pour la 
classe 




Classification 
donnees Spot 


Classification 

donnees 

RadarSat 


Fusion vote 
majoritaire 


Fusion vote 
majoritaire 
pondere 


Fusion par 
minimisation 
de confusion 


betterave 




97,84 


51,09 


80,33 


97,84 


97,84 


ble dur 




58,53 


38,05 


49,29 


58,12 


58,53 


ble tendre 




36,95 


36,78 


42,06 


36,23 


49,61 


colza 




44,77 


27,77 


40,48 


44,64 


42,80 


foret 




94,45 


82,13 


85,46 


93,37 


94,45 


herbe 




89,99 


80,18 


85,30 


89,95 


89,99 


mais 




80,67 


58,77 


67,42 


79,52 


80,67 


orge 




16,93 


19,31 


27,09 


16,95 


20,90 


pois 




69,88 


61,86 


64,99 


68,50 


72,37 


sol nu 




98,12 


72,61 


90,23 


97,89 


98,12 


urbain 




82,13 


84,53 


83,01 


82,13 


94,81 



tableau IV. 10 : Comparaison des indices des resultats de classification des donnees optique et radar et de leur 

fusion en fonction d’ indices de performance par classe 
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Chapitre IV : La fusion d’images issues de classifications supervisees 




figure IV. 14 : Composition coloree de l’image Spot 



figure IV. 15 : Composition coloree d’une image 
Radarsat non filtree utilisees pour la classification 





figure IV. 16 : Classification des donnees Spot par la 
methode ICM 



figure IV. 17 : Classification des donnees RadarSat par 
la methode ICM et une loi de Gauss-Wishart 
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5 : Applications des methodes de fusion a posteriori de resultats de classifications 




figure IV. 18 : Fusion vote majoritaire 




figure IV. 20 : Fusion par minimisation de confusion 




figure IV. 19 : Fusion vote majoritaire pondere 
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figure IV. 21 : Echantillons de verification 
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Chapitre IV : La fusion d’images issues de classifications supervisees 



5.3.2. La fusion de classifications de donnees Spot et ERS 

En region au climat tempere, les donnees optiques sont generalement bien adaptees pour 
l’etablissement de cartes de surfaces agricoles. Neanmoins, la precision des cartes obtenues par 
classification de donnees images est fortement dependante des dates d’ acquisition de ces 
images. En effet, les stades phenologiques des cultures doivent pouvoir etre reperes dans la 
serie temporelle. La precision temporelle des prises de vue optiques etant dependante de la 
clemence des conditions meteorologiques, les possibilites offertes par les capteurs radar 
spatiaux interessent les organismes charges d’effectuer ces suivis. 

Dans le cadre d’un contrat CNES, la classification etait la demiere etape d’un processus complet 
de traitement de donnees ERS-1 pour les rendre utilisables a des fins de suivi agricole. Ce 
processus inclut une pre- segmentation des images, un filtrage et une classification. 

Les donnees disponibles sont : 

6 images ERS-1, Single Look Complex (SLC), prises aux dates : 26 Mars 1993, 30 Avril 
1993, 04 Juin 1993, 09 Juillet 1993, 13 Aout 1993 et 17 Septembre 1993. 

2 donnees SPOT du 09 Juin 1993 et du 26 Aout 1993. 

2 jeux de verites terrain (apprentissage et verification). 

La zone sur laquelle nous avons travaille est formee de 2900 lignes de 1100 pixels, 
correspondant a une surface au sol d’ environ 36x14 km2 (le pixel correspond a une surface au 
sol de 12.5x12.5 m 2 ). 

Une methode de classification ICM avec loi de Gauss est appliquee aux images Spot. La meme 
methode est egalement appliquee aux images Radarsat non filtrees avec une loi de Gauss- 
Wishart. 

L’apport de la complementarite optique/radar lors de la fusion est ici plus important que pour 
l’application precedente. La methode de fusion par minimisation de confusion ameliore les 
resultats de performance globale de 2 % en moyenne (tableau IV. 11). Le tableau IV. 12 montre 
les resultats des performances par classe. L’apport de la fusion sur les performances par classe 
est ici assez faible. 

Les figures IV.22 a IV.29 presentent les differents resultats et donnees utilisees lors de cette 
application. Visuellement, nous pouvons constater l’amelioration des classes de bati et de 
forets. 
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5 : Applications des methodes de fusion a posteriori de resultats de classifications 



Criteres 
devaluation 
(en % sauf 
Kappa) 


Classification 
donnees Spot 


Classification 
donnees ERS 


Fusion 

vote 

majoritaire 


Fusion 

vote 

majoritaire 

pondere 


Fusion par 
minimisation 
de confusion 


AA 


86,60 


74,79 


79,15 


86,60 


88,05 


AP 


79,21 


70,35 


81,29 


79,22 


81,16 


OA 


88,36 


78,16 


85,18 


88,37 


90,79 


Kappa 


0,87 


0,75 


0,83 


0,87 


0,90 


AOCI 


70,11 


54,90 


64,71 


70,12 


72,92 


FI 


0,83 


0,73 


0,80 


0,83 


0,84 



tableau IV. 1 1 : Comparaison des classifications de donnees Spot et ERS et de leur fusion selon les 3 methodes 
introduites precedemment suivant les indices de performance globaux 



OCI (en %) 
pour la 
classe : 


Classification 
donnees Spot 


Classification 
donnees ERS 


Fusion vote 
majoritaire 


Fusion vote 
majoritaire 
pondere 


Fusion par 
minimisation 
de confusion 


ble dur 


70,54 


62,75 


69,95 


70,63 


70,91 


ble tendre 


63,21 


49,41 


46,70 


63,21 


63,75 


colza 


65,61 


80,15 


76,21 


65,67 


85,04 


eau 


98,59 


93,22 


94,37 


98,59 


98,64 


foret 


99,06 


83,78 


86,04 


99,06 


99,20 


mais 


90,78 


52,55 


86,27 


90,78 


90,78 


orge 


29,20 


10,19 


37,07 


29,20 


22,06 


pois 


50,14 


58,76 


66,58 


50,14 


53,52 


prairie 


74,07 


25,76 


44,48 


74,07 


73,28 


sol nu 


90,19 


28,17 


49,59 


90,19 


90,27 


tournesol 


61,58 


74,80 


69,37 


61,58 


81,93 


trefle 


21,40 


13,18 


28,11 


21,40 


21,40 


urbain 


96,99 


80,97 


86,50 


96,99 


97.15 



tableau IV. 12 : Comparaison des classifications de donnees Spot et ERS et de leur fusion selon les 3 methodes 
introduites precedemment suivant l'indice de performance OCI pour chaque classe 
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Chapitre IV : La fusion d’images issues de classifications supervisees 
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5 : Applications des methodes de fusion a posteriori de resultats de classifications 



figure IV. 24 : Classification des donnees Spot par 
classification ICM 



figure IV. 25 : Classification des images Radarsat non 
filtrees par classification ICM 



J Non Classe | | Ble dur 

I Foret 



J Mai's 
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Urbain 
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Chapitre IV : La fusion d’images issues de classifications supervisees 




figure IV. 26 : Fusion par vote majoritaire des figure IV. 27 : Fusion par vote majoritaire pondere 

classifications Spot et Radarsat des classifications Spot et Radarsat 



J Non Classe | | Ble dur | [ Mai's Orge 

I Foret j I Ble tendre Tournesol | Colza 



Pois | | Prairie 

Trefle | Sol nu 



Eau 

Urbain 
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5 : Applications des methodes de fusion a posteriori de resultats de classifications 




figure IV. 28 : Fusion par minimisation de confusion 
des classifications Spot et Radarsat 




4T 



figure IV. 29 : Echantillons de verification 
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Chapitre IV : La fusion d’images issues de classifications supervisees 



5.4.La fusion des meilleurs jeux de donnees temporelles, spectrales et classifieurs, 
application du systeme SCF 

Dans le cadre du systeme de Selection-Classification-Fusion (SCF), plusieurs selections de 
donnees ont ete faites afin de maximiser la performance suivant plusieurs criteres : une 
classification qui maximise la performance globale et pour chaque classe, une classification qui 
maximise l’indice de performance de cette classe. Cette selection s’est effectuee sur les dates, 
les canaux spectraux et le classifieur applique (paragraphe 4.2). Afin d’exploiter cette 
complementarite, nous avons applique les methodes de fusion a posteriori introduites dans le 
paragraphe 3 sur ces applications de selection. 

Cette methode est egalement appliquee au cours du chapitre 6 sur plusieurs annees : donnees 
Spot 2/4/5 de 2006 a 201 1 et Formosat-2 de 2006 a 2010. Les resultats sont presentes en annexe 
1 . 

5.4.1. L’application aux donnees Formosat-2 de l’annee 2009 

Un jeu de donnees de reference globale et un jeu de donnees de reference pour chaque classe 
ont ete selectionnes. Leur fusion par methode de minimisation de confusion permet 
l’augmentation des indices globaux (en moyenne 1 %, tableau IV. 13). Les methodes par vote 
majoritaire sont ici peu performantes du fait du grand nombre de donnees a fusionner. Les 
conclusions sont similaires a celles faites au paragraphe 5.2.1. 

5.4.2. L’application aux donnees Spot-2/4/5 de l’annee 2007 

Le tableau IV. 14 indique une faible amelioration des performances pour la methode de fusion 
par minimisation de confusion, les resultats de la classification de reference etant deja eleves. 
Les conclusions concemant la robustesse de cette methode se confirment de nouveau pour cette 
application. 

5.4.3. L’application aux donnees Landsat-5 de l’annee 2010 

L’ amelioration des performances est plus importante que lors de la fusion des meilleurs jeux de 
donnees temporels (tableau IV. 15). Le fait de selectionner les canaux spectraux et le classifieur 
a done permis de mettre en avant une meilleure complementarite des resultats de classification. 
Nous retrouvons le probleme de redondance d’erreurs pour les methodes de fusion par vote 
majoritaire. 
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5 : Applications des methodes de fusion a posteriori de resultats de classifications 



Criteres devaluation 
(en % sauf Kappa) 


Reference 

globale 


Fusion vote 
majoritaire 


Fusion vote 
majoritaire 
pondere 


Fusion par 
minimisation de 
confusion 


AA 


94,08 


93,92 


93,92 


94,44 


AP 


90,95 


90,13 


90,12 


91,52 


OA 


91,40 


90,95 


90,94 


92,40 


Kappa 


0,91 


0,90 


0,90 


0.92 


AOCI 


85,64 


84,78 


84,78 


86,56 


FI 


0,92 


0,92 


0,92 


0,93 



tableau IV. 13 : Comparaison des indices de performance globale de la reference globale et des fusions pour 

1’ application Formo sat-2 annee 2009 



Criteres devaluation 
(en % sauf Kappa) 


Reference 

globale 


Fusion vote 
majoritaire 


Fusion vote 
majoritaire 
pondere 


Fusion par 
minimisation de 
confusion 


AA 


93,10 


91,67 


91,64 


93,32 


AP 


89,70 


85,56 


85,55 


89,30 


OA 


89,71 


90,14 


90,13 


91,14 


Kappa 


0,87 


0,88 


0,88 


0.89 


AOCI 


77,55 


73,37 


73,34 


77,60 


FI 


0,91 


0,89 


0,89 


0.91 



tableau IV. 14 : Comparaison des indices de performance globale de la reference globale et des fusions pour 

F application Spot 2/4/5 annee 2007 



Criteres devaluation 
(en % sauf Kappa) 


Reference 

globale 


Fusion vote 
majoritaire 


Fusion vote 
majoritaire 
pondere 


Fusion par 
minimisation de 
confusion 


AA 


75,09 


73,51 


74,84 


75,70 


AP 


54,03 


51,24 


52,40 


55,21 


OA 


70,50 


72,66 


72,92 


72,67 


Kappa 


0,67 


0,69 


0,70 


0.70 


AOCI 


41,25 


39,70 


41,21 


44,57 


FI 


0,63 


0,60 


0,62 


0.64 



tableau IV. 15 : Comparaison des indices de performance globale de la reference globale et des fusions pour 

l’application Landsat 5 annee 2010 
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Chapitre IV : La fusion d’images issues de classifications supervisees 



6. Conclusion 

L’objectif de ce chapitre etait d’introduire une methode de fusion de donnees automatique, 
performante et robuste afin d’utiliser au mieux la diversite et la complementarity des donnees 
multidimensionnelles pour la classification. 

La methode de fusion originale introduite lors de ce chapitre a montre de multiples avantages : 
elle permet la combinaison de resultats obtenus avec des lois differentes et des jeux de donnees 
varies (multi-temporelles et multi-sources). Ces methodes n’ont pas de limites du nombre de 
classes et de failles d’images, contrairement aux methodes telles que DST ou DSmT. De plus, 
l’execution de cette methode de fusion originale est tres rapide, de l’ordre de la minute. 

Comme toute autre methode de fusion, la methode presentee n’a d’interet que lorsque les 
informations fournies sont complementaires et done non redondantes. Neanmoins elle permet 
la fusion automatique de tous types de donnees sans perte de performance, ce qui lui procure 
robustesse et performance. 

Cette methode de fusion est done choisie dans le cadre du systeme automatique d’ amelioration 
du resultat de classification appele Selection-Classification-Fusion. 

Une perspective de ce travail serait l’integration de la matrice de similitude en lieu et place de 
la matrice de confusion afin d’etendre cette methode au monde des classifications non 
supervisees. 
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Chapitre V. La classification a partir d’une collection de 
donnees statistiques de valeurs radiometriques 



Resume : 

Par manque de connaissance et absence de verites terrain, on ne peut pas appliquer de methode 
de classification supervisee. Dans ce cas, une classification non supervisee est utilisee, mais se 
pose alors le probleme de son interpretation (vu au chapitre I). Pour faciliter la connaissance 
des themes de 1’ image etudiee, j’ai developpe une methode permettant la classification sans 
verite terrain. Cette methode de classification utilise des statistiques de valeurs radiometriques, 
interpolees par methode de Krigeage a partir de donnees d’annees differentes et/ou de zones 
differentes. Cette methode a ete testee sur deux applications distinctes, l’une pour la 
classification a l’aide de references d’une zone differente mais comparable, l’autre a l’aide de 
references d’annees precedentes. Les resultats sont satisfaisants et indicatifs pour l’occupation 
du sol. 



Mots cles : interpolation, krigeage, classification sans verite terrain 











"Les mathematiques ont des inventions tres subtiles et qui 
peuvent beaucoup servir, tant a contenter les curieux qu'a 
faciliter tous les arts et a diminuer le travail des hommes." 

Rene Descartes 




u 
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Chapitre V : La classification a partir d’une collection de donnees statistiques de valeurs 
radiometriques 
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1 : Introduction 



1. Introduction 

Lorsqu’un processus d’ acquisition de verites terrains est impossible (zone eloignee, annee 
passee, annee en cours), les seules methodes de classifications utilisables sont les methodes non 
supervisees. Ces classifications necessitent une interpretation empirique dans la majorite des 
applications. Ce processus d’ interpretation est generalement fastidieux. II peut etre purement 
visuel. Lorsque Ton dispose de valeurs radiometriques du type de themes presents dans la zone 
a etudier, une autre solution consiste a 1’ interpretation a l’aide des mesures de similitudes (voir 
Chapitre II). 

Nous prendrons ici le probleme inverse a la seconde solution : au lieu d’ interpreter une 
classification non supervisee, nous dirigerons le processus de classification a partir de donnees 
radiometriques spectrales et temporelles connues et obtenues sur des annees ou des zones 
differentes. Ce processus se rapprochera du mode supervise. 

Ce processus s’avere particulierement adapte au traitement de larges zones d’etude qu’offfent 
les donnees des programmes Landsat et Copernicus. Dans le cas de Copernicus, le satellite 
"Sentinel-2" fournira gratuitement des images avec une couverture systematique de toutes les 
terres pour une repetitivite de 10 jours avec un seul satellite, et une repetitivite de 5 jours avec 
deux satellites, le tout a une resolution de 10 metres. 

2. Interpolation des donnees statistiques 
2.1. Methodes d’ interpolation par Krigeage 

A partir de donnees disposees de maniere irreguliere dans l’espace temporel et spectral, la 
methode d’ interpolation la plus efficace est la methode du Krigeage. 

Le Krigeage porte le nom de son precurseur, l'ingenieur minier sud-africain D.G. Krige. Dans 
les annees 1950, Krige (Krige, 1951) a developpe une serie de methodes statistiques empiriques 
afin de determiner la distribution spatiale de minerais a partir d’un ensemble de forages. La 
formalisation et la nomination de la methode sont cependant dues a Matheron (Matheron, 
1963). Depuis, le domaine de ses applications a largement ete etendu, touchant notamment la 
meteorologie, les sciences de l’environnement et 1’electromagnetisme. 

Commengons par definir cette methode. 

Definition : le Krigeage est une methode d'estimation lineaire, sans biais, minimisant la 
variance d'estimation telle que calculee a l’aide du variogramme [Marcotte]. Cette methode tient 
compte non seulement de la distance entre les donnees et le point a estimer, mais egalement de 
la distance des donnees entre elles. 

Dans le cadre d'un modele d'estimation stationnaire, il existe deux formes de Krigeage pour 
estimer la variable Y* en fonction des observations Y, et des A i? variables a optimiser. 
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Chapitre V : La classification a partir d’une collection de donnees statistiques de valeurs 
radiometriques 



le Krigeage simple qui suppose que la moyenne p du processus est connue 

nb_obs 



Y* = p + ^ AiCY; - p) 

i=l 



(V.l) 



(V.2) 



le Krigeage ordinaire, le plus utilise, qui suppose une moyenne inconnue 

nb_obs 

Y* = ^ AjYi 

i=l 

Considerons la methode d'interpolation par Krigeage ordinaire. 

Hypothese : pour un estimateur sans biais, l'equation V.3 doit etre verifiee. 

nb_obs 

^ Xj = 1 (V.3) 

i=l 

Le probleme a resoudre est done un probleme de minimisation sous contrainte d'une fonction 
quadratique, que l'on peut resoudre a l'aide du Lagrangien de l'equation V.4. 

( nb_obs 

i 



L(A, p) = a 2 + 2p| ^ Aj — 



[ = 1 

nb_obs nb_obs 



nb_obs 



nb_obs (V-4) 

= var(Y) + I I *,*,€<«(¥„¥,) -2 Y A,cov(Y,Y 1 ) + 2 h . Y “ 1 

i=l j=l i=l i=l 

On obtient un systeme lineaire a resoudre qui contient n+1 equations a n+1 inconnues. 

nb_obs 

^ AjCov(Yp Yj) + p = cov(Y, Y,), Vi e [1, nb_obs] (V.5) 

j=i 

La variance du Krigeage s'ecrit de la maniere suivante. 

nb_obs 



a^ 0 = var(Y) - ^ AjCovCY.Yj) - p 

i=l 



(V.6) 



Cette variance de Krigeage ne depend pas des valeurs observees, mais uniquement du 
variogramme et de la configuration des points servant a l'estimation par rapport aux points a 
estimer. 
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2 : Interpolation des donnees statistiques 



En conclusion, le Krigeage permet de minimiser la variance d'estimation theorique calculee a 
partir du variogramme. Le Krigeage est en moyenne plus juste que tout autre estimateur lineaire 
lorsque l'hypothese de stationnarite est valide et que le modele de variogramme est adapte, en 
particulier lorsque les donnees observees ne forment pas une grille reguliere. 

Les principals proprietes et caracteristiques associees au Krigeage sont fournies par Marcotte 
(Marcotte, 1991) : 

Le modele est lineaire, sans biais et de variance minimale. 

L’interpolateur est exact : si Ton estime un point connu, on retrouve la valeur connue. 
L’ interpolation presente un effet d'ecran: les points les plus pres regoivent les poids les 
plus importants. Cet effet d'ecran varie selon la configuration et selon le modele de 
variogramme utilise pour le Krigeage. Plus l'effet de pepite est important, moins il y a 
d'effet d'ecran. 

L’interpolateur tient compte de la taille du champ a estimer et de la position des points 
entre eux. 

Le modele est transitif. Si Ton observe en un point une valeur coincidant avec la valeur 
« krigee » pour ce point, alors les valeurs « krigees » en d'autres points ne sont pas 
modifiees par l'inclusion de ce nouveau point dans les « krigeages ». Par contre les 
variances de Krigeage sont diminuees. 

2.2. Evaluation de 1’ interpolation temporelle des classes 

Afin d’evaluer l’estimation des nouvelles classes (moyennes, covariances), il convient de 
calculer les matrices de similitudes (Chapitre II paragraphe 3) et d’en extraire les indices de 
performance de 1’ interpolation. 
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Chapitre V : La classification a partir d’une collection de donnees statistiques de valeurs 
radiometriques 

3. Applications 

3.1. Application a la classification de donnees d’annees differentes et d’une emprise 
differente 

Prenons l’exemple de la classification d’une zone de 1,2 millions d’hectares a l’ouest de 
Toulouse, couverte par des images Landsat-5 pour l’annee 2011. Ne disposant pas de verite 
terrain pour effectuer une classification supervisee, nous avons applique la methode 
d’interpolation de statistiques. Ces statistiques ont ete obtenues a partir de la zone Est de 
Toulouse (Tarn, Aude, Haute-Garonne) couverte par des images Landsat-5/7 de l’annee 2010. 
A partir des verites terrain de cette zone connue, nous avons interpole les statistiques de 
moyenne et de covariances radiometriques de 2010 sur l’axe temporel de 2011. Nous disposons 
de 1 1 dates en 2010 (1 Fevrier ; 24 et 25 Mai ; 11, 19, 20 Juillet ; 20, 21 et 29 Aout ; 22 et 29 
Septembre) et de 4 dates en 201 1 (24 Mars, 9 Avril, 1 1 Mai et 2 Octobre). 

Une acquisition recente de verites terrain pour la zone a classer nous a permis d’evaluer 
precisement la qualite de 1’ interpolation et de la classification. L’ interpolation est assez 
performante avec une racine carree d’erreurs moyennes des classes de 5,14 et une similitude 
moyenne des classes interpolees de 91,21%. Le tableau V.l permet la comparaison des deux 
methodes, a l’aide des indices de performance obtenus a partir de verites terrain pour la 
validation. Nous observons une difference moyenne de 15% pour les scores des indices de 
performance globaux. Certaines classes sont tres bien classees par la nouvelle methode et 
obtiennent des scores proches de ceux de la classification supervisee (Ble, Eau, Mai's,. . .). 



La zone extraite presentee est la commune de Lannemezan dans le departement des Haute 
Pyrenees. La figure V.l illustre le resultat de la classification a partir des statistiques 
interpolees, et la figure V.2 le resultat de la classification a partir des verites terrains. 



Indices globaux 

(en % sauf Kappa et FI) 


Classification a partir des verites 
terrains 


Classification a partir des 
statistiques interpolees 


AA 


76,76 


63,97 


AP 


43,66 


36,99 


OA 


77,54 


64,68 


Kappa 


0,60 


0,52 


AOCI 


30,66 


28,55 


FI 


0,552 


0,47 


Extrait des indices par classe 






Valeur OCI de la classe : 






Bad dense 


73,19 


67,56 


Ble 


97,77 


90,25 


Bocages 


54,43 


50,24 


Colza 


88,56 


81,74 


Eau 


96,32 


94,43 


Feuillus 


88,75 


81,92 


Jacheres 


60,06 


50,10 


Mai's 


89,70 


82,80 


Prairie 


71,07 


60,60 


Toumesol 


84,89 


78,36 



tableau V.l : Comparaison des indices de performance de la methode avec et sans verites terrain de la zone a 

etudier 
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3 : Applications 




figure V.l : Extrait de la classification des donnees Landsat-5 annee 2011 a partir des statistiques 
interpolees, zone de la commune de Lannemezan 




figure V.2 : Extrait de la classification des donnees Landsat-5 annee 2011 a partir des verites terrain, 

zone de la commune de Lannemezan 



Non Classe 
Feuillus 



Ble 



Colza | Vignes 

Mai's | Jacheres 

Tournesol I Prairie 



Bocages 

Eau 

Bati dense 



figure V.3 : Legende 



Surface minerale 
Bati diffu 
F riche 
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Chapitre V : La classification a partir d’une collection de donnees statistiques de valeurs 
radiometriques 



3.2. Application a la classification de donnees d’une annee differente 

Disposant une serie temporelle de 5 annees de donnees Formosat-2 couvrant notre zone d’etude 
du sud-ouest toulousain, nous nous proposons de tester la methode d’interpolation et de 
classification en utilisant les statistiques des annees 2006 a 2009 qui serviront a l’apprentissage 
pour 1’ interpolation des statistiques sur l’annee 2010. 

L’ interpolation des statistiques de moyennes, ecarts-types et extrema pour la classe « Ble » est 
illustree en figure V.4. Mis a part certains points extremes qui represented des fluctuations 
annuelles des stades phenologiques, 1’ interpolation est correcte avec une racine carree d’erreurs 
moyennes des classes de 4,34 et une similitude moyenne des classes interpolees de 96,32%. 
L’interpolation de la matrice de covariance est plus difficile car elle necessite un nombre plus 
important de dates pour une estimation correcte du fait de la bi-dimensionnalite de la 
covariance. La figure V.5 illustre 1’ interpolation de la matrice de covariance pour le canal PIR 
de la classe Feuillus. 

En comparant la classification effectuee avec les statistiques interpolees (figure V.6) et celle 
effectuee avec des verites terrain acquises sur la zone a classer (figure V.7), nous observons 
une difference au niveau de certaines cultures (Colza/Ble et Mais/Tournesol, voir encadres 
rouge des figures V.6 et V.7). Nous observons egalement une difference au niveau des 
performances globales, de l’ordre de 20% (tableau V.2). Ces differences sont dues aux erreurs 
d’interpolation des classes de cultures du fait des fluctuations annuelles des stades 
phenologiques, ce qui peut entrainer des confusions entre cultures d’une meme saison. 



Indices globaux 


Classification a partir des 


Classification a partir des 


(en % sauf Kappa et FI) 


verites terrains 


statistiques interpolees 


AA 


98,10 


80,14 


AP 


98,00 


72,10 


OA 


98,45 


75,22 


Kappa 


0,97 


0,73 


AOCI 


93,92 


69,19 


FI 


0,98 


0,76 


Valeur OCI de la classe : 






Bati (2) 


91,30 


72,01 


Ble dur 


94,37 


47,70 


Chanvre 


99,63 


75,98 


Colza 


97,57 


53,65 


Eau (3) 


100,00 


76,88 


Eucalyptus 


100,00 


85,14 


Feuillus 


99,96 


86,02 


Jachere 


64,47 


41,21 


Mai's (2) 


99,84 


92,35 


Orge 


87,85 


61,32 


Peupliers 


100,00 


77,66 


Prairie 


74,97 


45,39 


Resineux 


100,00 


84,13 


Soja 


99,83 


48,05 


Sorgho 


99,47 


84,36 


Tournesol 


93,49 


75,21 



tableau V.2 : Comparaison des indices de performance de la methode avec et sans reference spatiale de la zone 
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Valeur de covariance 



3 : Applications 




600 ^, 



500 



400 

•G 



300 



100 



Janviej 



Mars 



Avril 



Juin 



Juillet 



Aout 

Septi 



ptembre 



ovembre 

Decembre 



figure V.4 : Interpolation de la moyenne-ecart-type-minimum-maximum des valeurs radiometriques de la classe 
Ble pour les canaux B1 : Bleu, B2 : Vert, B3 : Rouge et B4 : Proche IR a partir de 4 annees : 2006 a 2009. Pour 
chaque canal, le trait central en noir represente la moyenne interpolee, les traits pleins bleu et rouge les ecarts- 
types relatifs a la moyenne et en traits discontinus, les extrema interpoles. 




figure V.5 : Interpolation de la matrice de covariance pour le canal PIR de la classe Feuillus. Les echelles sont en 

jour de l’annee et en valeur de covariance. 
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Chapitre V : La classification a partir d’une collection de donnees statistiques de valeurs 
radiometriques 




figure V.6 : Extrait de la classification des donnees Formosat-2 annee 2010 a partir des statistiques 

interpolees 




figure V.7 : Extrait de la classification des donnees Formosat-2 annee 2010 a partir des verites terrain 



Non classe ble tendre 


| sorgho 


prairie temporaire 


gravieres 


batti diffus 


| feuillus 


| colza 


| soja 


| eau libre 


peupliers 


| surface minerale 


| resineux [__| orge 


| pois 


| lac 


^ eucalyptus 2 


| mais ensilage 


eucalyptus mais 


jachere_surface gel 


| bati dense 


chanvre 


| mais non irrigue 


ble dur 


| tournesol 


| f riche 


bati ind_surf minerale 


pre_prairie permanente 
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4 : Conclusion 



4. Conclusion 

L’objectif de ce chapitre etait d’obtenir l’occupation du sol sans verite terrain de la zone a 
etudier, mais en disposant d’une collection de references statistiques sur d’autres zones ou 
d’autres annees. 

Concernant la methodologie developpee et appliquee, 1’ interpolation par Krigeage a foumi de 
tres bons resultats. Cette methode a permis d’interpoler les differentes statistiques utilisables 
par le systeme de classification. Comme toute autre methode d’interpolation, elle necessite un 
minimum de points significatifs d’observation, ce qui est difficile a obtenir pour 1’ interpolation 
des statistiques bidimensionnelles telles que les matrices de covariance. 

Concernant la classification a partir de ces statistiques interpolees, nous remarquons que les 
performances sont inferieures a celles des methodes supervisees avec verites terrain. 
Cependant, les resultats obtenus fournissent une indication, parfois indispensable, de 
l’occupation du sol sans verite terrain. Des differences se situent essentiellement au niveau des 
classes dont le cycle phenologique varie d’une annee a l’autre, ce qui engendre des confusions 
entre classes de cultures tres proches en matiere de pratique culturale. 

Les resultats sont done satisfaisants et fournissent une indication pour des modeles de prevision. 
Les resultats de l’application Landsat annee 2011 ont notamment servi au projet BLLAST 
(Boundary Layer Late Afternoon and Sunset Turbulence , site de Lannemezan) dont l’objectif 
est l’etude de la diffusion de la vapeur d’eau. Ce type de modele necessite des cartes 
d’occupations du sol de T annee en cours. 
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Chapitre VI. Analyse de changements annuels et 
modelisation de flux de carbone 



Resume : Un changement de mode d’ occupation du sol affecte directement les interactions entre 
la biosphere et l’atmosphere. A partir d’images de teledetection et de la creation de cartes des 
changements de l’occupation du sol, il est ainsi possible de quantifier les flux de carbone entre 
le sol et l’atmosphere. J’ai utilise les methodes presentees au cours des chapitres precedents et 
nous avons developpe un modele d’estimation de ces flux afin d’estimer les flux de carbone. 
Cette methodologie a ete appliquee a deux jeux de donnees differents et validee par croisement 
de resultats sur leur zone commune. Un bilan de carbone a ainsi pu etre calcule a partir de 
l’estimation des flux. 



Mots cles : changement d’occupation du sol, rotation de cultures, estimation de flux de carbone, 
SCF 
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Chapitre VI : Analyse de changements annuels et modelisation de flux de carbone 
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1 : Introduction 



1. Introduction 

Grace au nouveau systeme de classification et a l’amelioration des cartes d’occupation du sol, 
de nouvelles applications sont aujourd’hui realisables. Une premiere application rendue 
possible par les nouveaux outils presentes aux chapitres precedents est 1’ estimation des flux de 
carbone a l’aide d’images de teledetection a haute resolution (Ducrot, Masse, Ceschia, Marais- 
Sicre, & Krystof, 2010). Elle permet d’appliquer les modeles d’estimation de flux de carbone 
sur des zones plus vastes. 

Les objectifs du chantier Sud-Ouest du CESBIO (Ceschia) visent a comprendre et prevoir 
l’influence de l’homme et du climat sur les ressources en eau et les ecosystemes. Les activites 
humaines, parmi lesquelles la production par combustion de carbone fossile, la deforestation et 
1’ agriculture, sont fortement liees a d’importantes concentrations de gaz a effet de serre. Dans 
le cas du C0 2 , une alternative consiste a accroitre le role de « puits » temporaires que joue la 
vegetation, et principalement en augmentant la duree de stockage du carbone de cette biomasse. 
Un changement de mode d’occupation du sol affecte directement les interactions entre la 
biosphere et 1’ atmosphere. Une action anthropique par le reboisement, le changement 
d’utilisation des terres et de bonnes pratiques culturales peuvent augmenter la sequestration de 
carbone dans la biomasse et dans les sols pour des durees de plusieurs decennies, ce qui peut 
constituer un apport non negligeable a la lutte contre 1’ effet de serre. 

Plusieurs modeles ont ete developpes pour reproduire les echanges de quantite de carbone entre 
le sol et l’atmosphere ainsi que pour illustrer differents contextes de changement d’occupation 
du sol. L’ etude de 1’ evolution du stockage et du destockage de carbone dans le sol est complexe. 
Cette evolution est le resultat de reactions chimiques et physiques a plus ou moins long terme 
integrant le contexte de la zone observee et les divers echanges avec l’environnement. 

2. La rotation des classes, les enjeux 

Apres un changement d’occupation des terres, les vitesses de stockage dans le sol varient au 
cours du temps. Elies sont tres fortes apres un changement d’occupation du sol puis se 
stabilisent au bout d’une vingtaine d’annee apres avoir atteint un seuil de saturation du sol. 
Ainsi dans le cas de forets et sur des periodes de temps choisies, nous supposons que la teneur 
en carbone organique du sol est stable. 

Le premier enjeu consistera a identifier si une parcelle est cultivee ou s’il y a eu un changement 
d’occupation du sol (prairie vers cultures, ...) et a savoir si le systeme est stable ou non 
(changement de grandes classes) afin d’y appliquer un modele de changement. Ce modele 
permettrait de decrire revolution du carbone du sol lors d’un changement de grandes classes 
en prenant en compte la date de changement. 

Le second enjeu conceme l’enchainement des cultures et la capacite d’identification de 
l’enchainement de differentes cultures pour chaque parcelle. 
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Chapitre VI : Analyse de changements annuels et modelisation de flux de carbone 



La connaissance de la rotation des cultures nous permet d’identifier a partir des statistiques de 
rendements (Agreste, base de donnees statistiques agricoles) la quantite de carbone exporte a 
la recolte, la quantite de biomasse produite sur la parcelle pour une annee donnee, et d’estimer 
les pertes liees a la decomposition des residus de cultures des annees precedentes. 

Le troisieme enjeu porte sur la duree de decomposition des residus de cultures qui peut etre plus 
ou moins longue. Les consequences de cette decomposition tardive ont un impact sur l’annee 
observee et se repercutent sur l’annee suivante. Done, l’etude des rotations de cultures sur 
plusieurs annees successives permet de prendre en consideration ces decalages possibles. Dans 
cette etude, nous avons considere que l’essentiel des residus se decomposait l’annee suivante. 

3. Le modele de flux de carbone 

A partir de cartes de changement d’utilisation des terres pour les classes principales (forets, 
terres cultivees, paturages), nous souhaitons estimer les changements du Carbone Organique du 
Sol (COS) en appliquant un modele base sur les observations regionales (Arrouays et al., 2012). 

Pour realiser cette carte, nous avons choisi un modele permettant d’estimer les flux de carbone 
en fonction des changements de classes (ou du contexte de plantations/constructions, etc. . .). 

3.1. Les modeles existants 

Les modeles exponentiels existant (Henin & Dupuis, 1945) permettent d’avoir une vision 
annuelle de revolution de carbone et se basent sur un bilan entre le taux d’humidification de la 
matiere organique, le taux de mineralisation de la matiere organique humidifiee du sol et la 
prise en compte du temps ecoule depuis le dernier changement d’occupation. 

3.1.1. Le modele de Henin et Dupuis 

Le modele de Henin et Dupuis repartit le carbone des sols en un seul compartiment. Trois 
parametres decrivent le fonctionnement : 

la quantite d'apport de carbone au sol m (en tC.ha" 1 ); 

la proportion K1 de cet apport qui entre dans le compartiment sol, le reste etant suppose 
etre mineralise instantanement ; K1 est dit coefficient isohumique. 
le coefficient de destruction de la matiere organique K2 (en an' 1 ). La mineralisation suit 
une loi d'ordre 1. 



126 



te I- 0 0 9 2 1 8 5 3 , v e r s io n 



3 : Le modele de flux de carbone 



111 




co 2 

CO2 



figure VI. 1 : Modele de Henin-Dupuis 

En regime stationnaire, la quantite de carbone s'etablit a C s = KlXm 

K 2 

En regime transitoire, le carbone evolue selon la formule de l’equation VI. 1. 

C(t) = C s — (C s — C 0 )e _K2Xt ,avec C 0 carbone initial (VI. 1) 

Les valeurs des parametres sont decrites par Remy et Marin-Lafleche (Remy & Marin-Lafleche, 
1976). Des tables de valeurs indiquent par type de culture les restitutions moyennes, aeriennes 
ou souterraines (m), le coefficient isohumique (Kl) propre a chaque production vegetale ou a 
chaque amendement (fumiers, etc.). Le coefficient K2 est determine par la teneur en argile et 
en calcaire du sol. 



Notation 


Semantique 


Definition 


BC 


bilan carbone 


variation du stock de carbone 


NPP_tot 


Net Primary Production 
total 


Taux carbone pour la formation de biomasse totale 


NPP_aerien 


Net Primary Production 
aerien 


Taux carbone pour la formation de biomasse aerienne 


NPP_racinaire 


Net Primary Production 
racinaire 


Taux carbone pour la formation de biomasse racinaire 


RS 


Root/Shoot 


rapport en fonction de NNP_aerien et NPP_racinaire 


HR 


Harvest Residu 


Pourcentage de matiere NON seche 


HI 


Harvest Index 


rapport entre la quantite de matiere exportee et le 
NPP_aerien 


Rend 


rendement 


Quantite produite (source : Agreste) 


Ten 


teneur 


Teneur en carbone par matiere seche 


StockCulture 


Stock culture 


Quantite de carbone encore presente dans le sol de l'annee 
precedente 


CC 


Constante Correctrice 


Constante permettant de corriger l'estimation des exports en 
carbone 



tableau VI. 1 : Notations, semantiques et definitions 
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Chapitre VI : Analyse de changements annuels et modelisation de flux de carbone 



3.1.2. Modele developpe au CesBIO par Eric Ceschia 

La quantite de carbone stockee pendant une periode dans un sol depend fortement de ce qui 
repose dessus. Cela peut etre des sols nus, mais aussi des sols pour la culture, ou des sols de 
forets. Ainsi, une meilleure comprehension des echanges entre l’air, les 
plantes/arbres/constructions et le sol permet de developper un modele nouveau et different des 
autres approches, plus proche des realites des aleas des sols etudies. 

Dans le cas ou on reste sur les cultures, nous avons developpe une methode plus precise et 
specifique aux cultures. Cette approche est fondee sur le NPP, des indices de recoltes (harvest 
index), les exports de carbone sous diverses formes, les residus et la respiration de ces cultures. 

Le calcul des parametres non observables se fait a partir de donnees disponibles (par exemple 
la base de donnees Agreste). 

Soit a une classe et n une annee. 

NPP_racinaire(a, n) = RS(a) * NPP_aerien(a, n) 

HI(a, n) = export/NPP_aerien 

export(a, n) = rend(a, n) * (1 — HR) * ten(a, n) 

Ainsi on en deduit le NPP_tot(a,n) : 

NPP_tot(a, n) = NPP_aerien(a, n) + NPP_racine(a,n) 

= NPP_aerien x (1 + R/S) 

= (export/HI) x (1 + R/S) 

rend(a,n) x (1 — HR) x ten(a, n) + CC ( ^ _ R^ 

HI X V 1 + S/ 

Ainsi la formule de la variation du stock de Carbone du sol est : 

BC(a, n) = NPP tot (a, n) — Respiration(a, n — 1) — export(a, n) 
Respiration(a, n — 1) = taux * (NPP_tot(a, n — 1) — export(a, n)) 

’taux’ est un parametre representant le rapport entre la quantite de carbone liberee par la 
respiration et celle stockee dans le sol les annees precedentes. 

Ce modele n’a pas fait l’objet d’une publication pour le moment. 
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3 : Le modele de flux de carbone 



3.2. Le modele choisi 

Nous avons choisi d’inclure deux modeles pour illustrer la fluctuation de carbone dans le sol sur 
les zones etudiees. Dans le cas des changements de classes principales, forets et paturages, le 
bilan carbone est estime d’apres les modeles exponentiels. Dans le cas des cultures, l’approche 
faisant intervenir la NPP a ete utilisee (modele CesBIO). 

Le calcul du bilan carbone par la premiere approche n’influe pas sur le calcul par la deuxieme, 
ce qui explique notre approche combinee. 

La premiere prend en consideration les transitions de classes principales alors que la seconde 
est strictement axee sur les classes de cultures. 

La methodologie generate est resumee a la figure VI.2. 




figure VI.2 : Methodologie proposee pour l’estimation des flux de carbone a partir de la carte de rotation et des 

statistiques agricoles 
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Chapitre VI : Analyse de changements annuels et modelisation de flux de carbone 



4. Applications : carte des changements et estimation des flux de Carbone 
4.1. A partir d’images Formosat-2 des annees 2006 a 2009 

La zone d’etude est l’intersection des zones etudiees precedemment dans les annees 2006, 2007, 
2008 et 2009. Celle-ci a une surface totale de 50802 Ha. 




figure VI. 3 : Zone d’etude, emprise commune des differentes images Formosat-2 utilisees 

Dans un premier temps, le systeme de classification automatique SCF a ete applique sur les 
donnees de chaque annee. Les classes etudiees et les performances des classifications sont 
presentees en annexe 1.3. Un regroupement de certaines classes a ete opere suivant la 
nomenclature suivante : Bois (Feuillus, Resineux, Eucalyptus, Peupliers), Eau (Lac, Graviere), 
Bati et surfaces minerales (Bati dense, Bati industriel, Bati lache, Reseau routier, sols nus) et 
Surfaces enherbees (Prairie temporaire, Pre/prairie permanente, Jachere, Friche). Les classes 
de cultures sont restees independantes : Ble, Colza, Orge, Mai's, Tournesol, Sorgho, Soja, 
Pois, Chanvre (non regroupes). 

Le tableau VI.2 montre que le Mais est la seule culture qui n’a pas beaucoup changee. Elle est 
la plus representative des monocultures dans la zone d’etude. Les autres monocultures sont peu 
presentes : Ble, Soja, Tournesol (tableau VI.3). 

La rotation Ble-Tournesol est la rotation la plus importante avec un pourcentage de 
representativite dans la zone de 8%. La rotation annuelle entre le Ble et le Tournesol atteint un 
pourcentage du 5% par rapport au total de la zone etudiee (tableau VI.4). 

A partir des rotations de cultures (figure VI.4 a VI.5) et des statistiques agricoles de la zone, on 
calcule le bilan carbone a partir du modele presente precedemment (tableau VI.5). Sur la zone 
etudiee de 50000 ha, ce bilan est de 51409 tonnes de Carbone stocke en 4 ans soit 0,257 tonne 
de carbone stocke dans le sol par hectare et par an. 

La figure VI. 10 illustre le bilan carbone par pixels de l’image. 
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4 : Applications : carte des changements et estimation des flux de Carbone 




figure VI .4 : Image des rotations majoritaires obtenues a partir des images Formosat-2 sur les annees 2006 a 

2010 




figure VI.5 : Extrait de la figure VI .4 correspondant a 
l’encadre rouge 



Bois 

□ Surf, enherbees 
Mai's 
Eau 



Bati/Surf. minerale 
Ble-Tournesol 
| Ble- Colza - Tournesol 
| Surf, enherbees - Ble 
Ble-Colza 
J Mai's- Ble 
| Mai's - Tournesol 
| Surf, enherbees - Tournesol 
Surf, enherbees - Tournesol- Ble 
Ble - Tournesol - Sorgho 
| Ble - Colza - Orge 
J Mai's - Soja 
I Ble - Mai's - Tournesol 



Autres rotations 



figure VI. 6 : Legende des rotations 
majoritaires 
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Chapitre VI : Analyse de changements annuels et modelisation de flux de carbone 







Image de 2009 
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0,00 
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0,11 


24,55 


3,76 


0,51 


22,73 


20,47 


14,97 
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0,00 
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0,07 


18,28 
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28,77 
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3,96 


22,26 


5,68 


0,00 


0,15 




Surf. 

enherbees 


6,60 


3,03 


1,44 


1,43 


1,00 


3,52 
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0,07 


77,27 


0,02 


4,54 




Eau 


1,04 


0,02 


0,00 


0,01 


0,02 


1,35 


0,04 


0,00 


1,32 


85,04 


11,14 




Bati/Surf min 


0,85 


0,35 


0,15 


0,15 


0,11 


0,62 


0,04 


0,00 


13,69 


0,14 
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tableau VI.2 : Sur la diagonale : pourcentage des classes qui n’ont pas change de 2006 a 2009, les autres 
elements signifient un changement entre 2006 et 2009 



Non-changements/Monoculture 2006-2007-2008-2009 


Surface (ha) 


Frequence (%) 


Mais-Mais-Mais-Mais 


3338,55 


7,799 


Ble-Ble-Ble-Ble 


89,34 


0,209 


T ournesol-T ournesol-T ournesol-T ournesol 


23,20 


0,054 


Soja-Soja-Soja-Soja 


0,92 


0,002 


Bois-Bois-Bois-Bois 


3019,05 


7,052 


Surf. enherbees-Surf. enherbees-Surf. enherbees-Surf. enherbees 


7185,22 


16,785 



tableau VI.3 : Monocultures entre 2006 et 2009 





Surface (ha) 


Frequence (%) 


Ble-Toumesol- Ble-Tournesol 


2191,92 


5,120 


Ble-Colza- Ble-Colza 


453,95 


1,060 


Ble-Mais- Ble-Mais 


159,6 


0,373 


Ble-Orge- Ble-Orge 


32,74 


0,076 


Mais-Soja- Mais-Soja 


31,56 


0,074 


Tournesol-Surf. enherbees-Tournesol-Surf. enherbees 


29,98 


0,070 


Ble-Soja-Ble-Soja 


25,74 


0,060 


Ble-Surf. enherbees-Ble-Surf. enherbees 


25,18 


0,059 


Mais-Surf. enherbees-Mais-Surf. enherbees 


18,48 


0,043 


Orge-Mais-Orge-Mais 


8,84 


0,021 


Orge-T oumesol-Orge-T ournesol 


8,53 


0,020 


Mais-T oumesol-Mais-T ournesol 


5,12 


0,012 


Colza-Orge-Colza-Orge 


0,62 


0,001 


Surf. enherbees-Orge-Surf. enherbees-Orge 


0,52 


0,001 



tableau VI .4 : Bicultures entre 2006 et 2009 : rotations annuelles sur ces 4 annees 
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4 : Applications : carte des changements et estimation des flux de Carbone 



Rotations 


Bilan carbone (en tC/ha) 


Quantite de Carbone (en tC) 


Surface (en ha) 


mais-mais-mais-mais 


4,009 


15566,938 


3883,469 


tournesol-ble-tournesol-ble 


4,374 


5696,373 


1302,298 


ble-tournesol-ble-tournesol 


2,079 


3219,666 


1548,986 


tournesol-ble-ble-tournesol 


3,315 


1752,335 


528,621 


tournesol-ble-colza-ble 


4,060 


1267,442 


312,192 


colza-ble-colza-ble 


4,310 


1108,521 


257,171 


ble-ble-tournesol-ble 


3,215 


1012,628 


314,925 


ble-ble-colza-ble 


2,901 


775,902 


267,443 


ble-colza-ble-tournesol 


1,810 


745,225 


411,757 


mai s -ble-mai s -mai s 


3,949 


703,616 


178,176 


mais-mais-tournesol-mais 


3,937 


633,545 


160,941 


tournesol-ble-ble-colza 


2,502 


560,208 


223,891 


colza-ble-tournesol-ble 


4,625 


549,254 


118,765 


tournesol-ble-tournesol-tournesol 


3,120 


549,003 


175,936 


ble-colza-ble-ble 


3,063 


519,352 


169,530 


ble-surf. enherbees-ble-tournesol 


-1,073 


-100,362 


93,542 


ble-surf. enherbees -ble-colza 


-1,073 


-102,635 


95,661 


surf, enherbees - surf, enherbees -ble-tournesol 


-1,690 


-103,562 


61,274 


surf, enherbees - surf, enherbees -ble-ble 


-1,690 


-113,600 


67,213 


surf, enherbees -ble-ble-tournesol 


-1,690 


-115,893 


68,570 


surf, enherbees - surf, enherbees -ble-colza 


-1,690 


-162,655 


96,237 


surf, enherbees - surf, enherbees -ble- surf, enherbees 


-1,073 


-168,547 


157,094 


surf, enherbees - surf, enherbees -tournesol- surf, enherbees 


-1,073 


-200,408 


186,790 


surf, enherbees - surf, enherbees -tournesol-ble 


-1,690 


-263,740 


156,045 


surf, enherbees - surf, enherbees - surf, enherbees -tournesol 


-1,690 


-267,407 


158,214 



tableau VI.5 : Rotations des classes et bilan carbone associe pour les donnees Formosat-2 des annees 2006 a 2009 



133 



te I- 0 0 9 2 1 8 5 3 , version 



Chapitre VI : Analyse de changements annuels et modelisation de flux de carbone 




figure VI. 7 : Estimation du flux de Carbone pour l’emprise Formosat-2 annees 2006 a 2009 : unite en tonnes de Carbone par hectare, agrandissement en figure VI. 10 
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4 : Applications : carte des changements et estimation des flux de Carbone 



4.2. A partir d’ images Spot- 2/4/5 des annees 2006 a 2010 

La zone d’etude est l’intersection des zones etudiees pour les annees 2006, 2007, 2008, 2009 et 
2010. Celle-ci a une surface totale de 46146 ha. 

Co mm e pour 1’ application precedente, le systeme de classification automatique SCF a ete 
applique aux images Spot de chacune des cinq annees. Les performances de ces classifications 
sont presentees en annexe 1.4. 



Les rassemblements de classes sont similaires a ceux de 1’ application precedente. Le tableau 
VI.6 montre les classes n’ayant pas change sur la periode de 5 annees. 



Non-changements/Monoculture 2006-2007-2008-2009-2010 


Surface (ha) 


Frequence (%) 


Bois-Bois-Bois-Bois-Bois 


3583,48 


7,931 


Ble-Ble-Ble-Ble-Ble 


82,88 


0,183 


Mais-Mais-Mais-Mais-Mais 


2545,04 


5,633 


T ournesol-T ournesol-T oumesol-T ournesol-T ournesol 


2,36 


0,005 


Surf. Enherb-Surf. Enherb.-Surf. Enherb-Surf. Enherb.-Surf. Enherb. 


11867,88 


26,266 


Eau-Eau-Eau-Eau-Eau 


320,28 


0,709 



tableau VI.6 : Non changements et monoculture de l’annee 2006 a 2010 



Les rotations de cultures et des statistiques agricoles de la zone ont permis le calcul du bilan de 
carbone a partir du modele presente precedemment (tableau VI.7). 

Le bilan carbone de la zone etudiee de 46146 ha est de 90386 tonnes de Carbone stocke en 5 
ans soit 0,392 tonne de carbone par hectare par an stocke dans le sol. 

La figure VI.8 illustre le bilan carbone par pixels de l’image. 

L’ application suivante concemera la validation croisee de ces deux applications sur leur zone 
commune. 
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Chapitre VI : Analyse de changements annuels et modelisation de flux de carbone 



Rotations 


Bilan carbone (en tC/ha) 


Quantite de Carbone (en tC) 


Surface (en ha) 


ble-tournesol-ble-tournesol-ble 


4,284 


15166,956 


3540,560 


mais-mais-mais-mais-mais 


4,103 


10442,559 


2545,040 


tournesol-ble-tournesol-ble-tournesol 


2,641 


5632,628 


2132,520 


ble-colza-ble-tournesol-ble 


3,524 


2479,432 


703,560 


ble-tournesol-ble-colza-ble 


4,807 


2460,058 


511,800 


tournesol-ble-ble-tournesol-ble 


3,339 


1862,828 


557,840 


ble-ble-ble-tournesol-ble 


3,462 


1637,878 


473,120 


ble-tournesol-ble-mais-ble 


4,939 


1340,653 


271,440 


ble-colza-ble-colza-ble 


4,047 


1317,551 


325,560 


ble-mais-ble-mais-ble 


4,698 


1300,344 


276,800 


ble-tournesol-ble-ble-tournesol 


4,534 


1147,307 


253,040 


ble-ble-tournesol-ble-tournesol 


2,764 


1131,392 


409,360 


ble-ble-ble-colza-ble 


3,985 


960,330 


241,000 


mais-mais-mais-mais-ble 


4,045 


892,243 


220,560 


mai s -ble-mai s -mai s -mai s 


3,522 


882,587 


250,560 


surf, min.-surf, enherbees-surf. enherbees-tournesol- surf, enherbees 


-0,371 


-0,238 


0,640 


bois-surf. enherbees-bois-mais-bois 


-0,228 


-0,264 


1,160 


surf. min. -surf. min. -surf, min.-tournesol- surf, enherbees 


-0,371 


-0,327 


0,880 


surf, enherbees-surf. enherbees-surf. min.-ble- surf, enherbees 


-0,384 


-0,384 


1,000 


bois-bois-bois-mais- surf, enherbees 


-0,748 


-0,419 


0,560 


surf, enherbees-ble-surf. enherbees-ble- surf, enherbees 


-0,295 


-0,532 


1,800 


surf, enherbees-surf. enherbees-bois-mais- surf, enherbees 


-0,748 


-3,890 


5,200 


bois-bois-bois-mais-bois 


-0,228 


-5,217 


22,920 


surf, enherbees-surf. enherbees-surf. enherbees-ble- surf, enherbees 


-0,384 


-6,859 


17,840 


surf, enherbees-surf. enherbees-surf. enherbees-tournesol- surf, 
enherbees 


-0,371 


-10,432 


28,080 



tableau VI.7 : Rotations des classes et bilan carbone associe pour les donnees Spot des annees 2006 a 2010 
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4 : Applications : carte des changements et estimation des flux de Carbone 




figure VI. 8 : Estimation du flux de Carbone de 1’ emprise Spot-2/4/5 annees 2006 a 2010 : unite en tonnes de 

Carbone par hectare, agrandissement en figure VI. 1 1 
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Chapitre VI : Analyse de changements annuels et modelisation de flux de carbone 



4.3. Validation croisee de la zone commune des 2 satellites 



Une comparaison de resultats entre les deux etudes precedentes a ete realisee afm d’evaluer la 
stabilite des modeles d’estimation de flux de Carbone. En pratique, la zone commune a toutes 
les annees des deux applications est fortement reduite. La surface de superposition des deux 
applications est de 12002 ha. 




Ligende 



□ 



Zone SPOT 
2006-201 0 
ffcOkrn x 60 k ml 



| | ZoneFORMOSAT 

20D6-20D9 
r?4knn y 



figure VI. 9 : Zones couvertes par les satellites SPOT et FORMOSAT 



Du fait d’une resolution differente ente les images Formosat-2 (8m) et Spot (20m), l’erosion a 
un effet plus important sur le resultat de l’application des donnees Spot. Ce processus d’erosion 
est necessaire car il permet de reduire l’influence des mixels et des erreurs de decalages multi- 
temporels des images sur le modele d’estimation. (figure VI. 10 et figure VI. 11). 

Les resultats obtenus a partir des deux jeux de donnees independants sont similaires, les seules 
differences sont dues a une annee supplemental pour les images Spot. 
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4 : Applications : carte des changements et estimation des flux de Carbone 
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Chapitre VI : Analyse de changements annuels et modelisation de flux de carbone 



5. Conclusion 

L’objectif de ce chapitre n’etait pas d’evaluer la qualite des modeles d’estimation de flux de 
carbone mais plutot l’evaluer la robustesse des methodes de classification et des cartes de 
rotations qui en sont deduites. Les modeles d’estimation de flux de carbone necessitent des 
classifications les plus justes possibles afin d’eviter l’accumulation d’erreurs et la presence de 
faux changements d’ occupation des terres. 

Les applications ont permis de conclure qu’il etait possible de quantifier les flux de carbone 
entre le sol et l’atmosphere a partir d’images de teledetection a haute resolution. Ces 
applications ont egalement permis de selectionner les pratiques culturales qui permettent le 
meilleur stockage de carbone dans le sol et done de limiter les emissions de gaz a effets de serre. 

La validation croisee effectuee a partir des deux applications presentees (capteurs differents) a 
montre que le resultat du bilan carbone est constant et done que la methodologie appliquee (le 
systeme de classification automatique SCF) est robuste. 
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Chapitre VII. La classification de la Trame Verte et 
Bleue en milieu agricole, entre enjeux et realites. 




Resume : L’objectif principal de cette application est d’explorer les possibilites offertes par les 
donnees de teledetection et leur classification pour cartographier les elements de la trame verte 



(haies, corridors ecologiques, espaces boises). La methodologie proposee est testee sur 
plusieurs capteurs : radar avec TerraSar-X, optique avec un satellite a Tres Haute Resolution 
Spatiale (THRS) SPOT 5 (2,5m et 10m), Formosat (8m) ainsi que Worldview-2 (1,7m) et 
Pleiades (0,7m). Nous verrons ainsi que la multi-temporalite et la haute resolution des images 
sont un atout pour la cartographic des trames vertes. 

Mots cles : Trame verte et bleue, haies, Copernicus, Grenelle-2 
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Chapitre VII : La classification de la Trame Verte et Bleue en milieu agricole, entre enjeux et realites. 
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1 : Introduction 



1. Introduction 

La Trame Verte et Bleue, qui est l’un des engagements du Grenelle Environnement (en 2007), 
est une demarche qui vise a maintenir et a reconstituer un reseau d’echanges sur le territoire 
national pour que les especes animates et vegetales puissent, de la meme maniere que 1’ Homme, 
communiquer, circuler, s’alimenter, se reproduire, se reposer. En d’autres termes, assurer leur 
survie. 

Elle contribue ainsi au maintien des services que nous rend la biodiversite : qualite des eaux, 
pollinisation, prevention des inondations, amelioration du cadre de vie, etc. 

La biodiversite, fruit d’un travail de la nature depuis quelques 4 milliards d’annees, est 
aujourd’hui menacee du fait de l’activite incessante des hommes. En France, environ 165 ha de 
milieux naturels et terrains agricoles (soit un peu plus de quatre terrains de football) sont detruits 
chaque jour, remplaces par des routes, habitations, zones d’activites. Cela equivaut a plus de 
60000 ha par an, soit un departement comme la Savoie tous les 10 ans. 

L’enjeu de la constitution d’une trame verte et bleue s’inscrit bien au-dela de la simple 
preservation d’espaces naturels isoles et de la protection d’especes en danger. II est de 
(re)constituer un reseau ecologique coherent qui permette aux especes de circuler et d’interagir, 
et aux ecosystemes de continuer a rendre a Fhomme leurs services. 

Une espece a besoin d’un effectif minimal d’individus pour survivre aux differents obstacles 
naturels tels une epidemie ou une predation, et done d’un territoire assez grand. Le projet Trame 
Verte et Bleue consiste directement a constituer un territoire pouvant accueillir ces especes et 
assurer ainsi leur survie. Une ville entiere sans arbre ni surface herbee est synonyme d’une 
discontinuity entre plusieurs espaces naturels aux alentours, et done synonyme de 1’ extinction 
de certaines de ces especes abritees par ces milieux. En creant ce maillage et done une continuity 
entre differents espaces abritant de nombreuses especes, on contribue a leur survie et au 
maintien de la biodiversite. 

L’objectif principal de ce chapitre est d’explorer les possibility offertes par les methodes de 
classification appliquees aux donnees de teledetection pour la cartography des haies et des 
espaces boises. Une methodologie est proposee et testee sur des images a caracteristiques 
diverses (optique/radar, haute et tres haute resolution spatiale, repetitivite temporelle) dont les 
capteurs suivants : TerraSar-X (radar, 3m), Spot-5 (2,5m et 10m), Formosat (8m), Worldview- 
2 (1,7m) et Pleiades (0,7m). 

L’etape la plus complexe est la validation des resultats de classification, la trame verte etant un 
« objet » particulier, qui est en general est fin, heterogene et multiforme. La prise d’echantillons 
est alors delicate et fastidieuse, mais indispensable pour valider la methodologie. Pour avoir 
une validation de la detection des haies la plus precise possible, nous utiliserons la photo- 
interpretation a partir de la BD-Ortho ® (source IGN) et d’images de satellites. 
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Chapitre VII : La classification de la Trame Verte et Bleue en milieu agricole, entre enjeux et realites. 



2. Etudes de l’utilisation de la teledetection pour la cartographie de la trame verte 
en milieu agricole 

L’utilisation d’ images de teledetection pour la cartographie de la trame verte en milieu agricole 
est une problematique jusqu’a lors peu etudie. Pour cela, nous avons mis en pratique les outils 
presentes aux chapitres precedents. 

Nous presenterons plusieurs etudes concemant la classification de la Trame verte, l’une sur 
l’interet de la resolution spatiale et l’autre sur le choix du classifieur. 

Les details de ces etudes sont publies et les articles disponibles en annexe 3.1 et 3.2. 

2.1. Etude de 1’ impact de la resolution spatiale pour la cartographie de la trame verte en 
milieu agricole 

Pour cette etude, nous avons tente de determiner les capteurs qui permettent la meilleure 
cartographie des elements de la trame verte (haies, arbres isoles, ...). La liste des capteurs 
utilises est la suivante : 

Spot-5, annee 2010, 10 metres de resolution 
Formosat-2, annee 2007, 8 metres de resolution 
Terrasar-X, annee 2009, 3 metres de resolution 
Spot-5, annee 2010, 2.5 metres de resolution 
Pleiades- 1, annee 2012, 0.70 metre de resolution 

2.1.1. Comparaison des capteurs a haute resolution pour la cartographie des haies 

La comparaison des capteurs Formosat-2, Spot-5 (2.5m) et TerraSAR-X a donne lieu a un 
article de conference a comite de lecture (Ducrot, Masse, & Ncibi, 2012) disponible en annexe 
3.2. L'objectif principal de cette etude est d'explorer le potentiel des methodes de classification 
pour la cartographie des haies, des corridors et des forets. Nous presentons une methodologie 
basee sur la classification, supervisee et non supervisee, la segmentation et la fusion de 
classification. Nous avons conclu que l’emplacement des haies peut etre detecte aux echelles 
de 2.5 a 8 metres, les meilleurs resultats de classification sont cependant obtenus avec une 
resolution de 2,5 metres. La multi temporalite est aussi importante pour la detection des haies, 
notamment avec des dates de printemps et d’automne. 

Cette etude a ete completee avec le capteur Spot-5 a 10 metres de resolution. La classification 
obtenue foumit de tres bons resultats. Les haies sont bien discernables sauf certaines plus 
etroites qui se distinguent plus difficilement. Neanmoins, le resultat est tres satisfaisant pour 
cette resolution (figures VII. 1 et VII.2). Les lisieres de forets sont souvent classees en Haie car 
elles possedent une signature spectrale differente de celle des forets de feuillus ou de resineux, 
mais proche de celle des haies. Par des methodes de post-classifications, elle a pu etre extraite 
en tant que classe Lisieres, et done separee de la classe Haie. 
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2 : Etudes de l’utilisation de la teledetection pour la cartographic de la trame verte en milieu agricole 




Figure VII. 1 : Composition coloree d’une image 
Spot-5 (10m) en fausse couleur (PIR, R, V) 



Figure VII. 2 : Resultat de la classification des 
donnees Spot-5. Legende : Haies en violet, Feuillus 
en vert, Jachere en gris, Prairie en vert clair 



2.1.2. Utilisation de donnees a Tres Haute Resolution Spatiale (THRS) 

Dans l’article (Sheeren et al., 2012) presente en annexe 3.1 et dont je suis co-auteur, nous 
proposons d’evaluer les potentialites de l’iniagerie satellitaire a tres haute resolution spatiale 
pour cartographier la composante arboree de la trame verte en milieu agricole. L’identification 
des formations ligneuses, incluant les haies et les arbres isoles, est realisee a partir de donnees 
multi-angulaires WorldView-2 en comparant deux approches de classification supervisee : 
modele de melange gaussien et methode contextuelle ICM. Les resultats montrent de bonnes 
performances en exploitant les deux vues du couple stereoscopique (kappa de 0,88) avec un 
gain de 13 a 22 % par rapport a l’utilisation d’une seule vue. La qualite d’extraction des haies 
varie selon le type de haie, le voisinage des objets, les ombres et les effets de la visee oblique. 
Les differences de performance entre les methodes de classification sont quant a elle 
negligeables. 

En complement de cette etude, le nouveau satellite Pleiades (annexe 1.6) a permis tres 
recemment l’acquisition d’images a Tres Haute Resolution Spatiale (0,7 metre). La 
classification supervisee de la zone commune aux deux images Pleiades presentees en (annexe 
1.6, dates de Mars et Novembre 2012) permet une cartographic precise des haies du fait de la 
tres haute resolution du capteur. Les classes « feuillus, resineux, peupliers, haie haute et haie 
basse » se cotoie au sein d’une seule et meme haie car les haies champetres sont naturellement 
composees de ces especes (figures VII. 3 a VII.5). 
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Chapitre VII : La classification de la Trame Verte et Bleue en milieu agricole, entre enjeux et realties. 




figure VII. 3 : Composition coloree (fausses couleurs) de 1’ image Pleiades de mars 2012 




figure VII.4 : Composition coloree (fausses couleurs) de 1’ image Pleiades de novembre 2012 




figure VII.5 : Extrait de l’image classee par la methode ICM. Legende : Orange = cultures ete, Jaune = cultures 
hiver, Violet clair = Haie haute, Violet fonce = Haie basse, Vert = Feuillus, Vert fonce = Resineux 
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2 : Etudes de l’utilisation de la teledetection pour la cartographic de la trame verte en milieu agricole 



2.2. Etude de l’impact du choix de la methode de classification pour la cartographic des 
haies 

A partir des donnees Spot-5 de l’annee 2010 (10 metres de resolution spatiale), nous avons 
compare les methodes ICM et SVM presentees au chapitre 1 (en mode supervise). 

Le tableau VII. 1 montre que l’algorithme ICM offre de meilleurs resultats pour la cartography 
de l’occupation du sol a partir des 10 dates de 2010 et de 3 1 classes (celles presentees en annexe 
1.4 ainsi que 5 classes specifiques a la trame verte dont la classe haie, bosquets et ligneux). Les 
resultats sont en moyenne 10% superieur pour la methode ICM en matiere d’indices de 
performance globale. Pour les classes de trames vertes, les differences de resultats sont 
beaucoup plus marquees avec des ecarts de plus de 60% en faveur de la methode ICM. 



Indices de performance 
(en % sauf Kappa et FI) 


Classification ICM 


Classification SVM 


AA 


95,24 


90,52 


AP 


91,42 


70,11 


OA 


90,11 


81,28 


Kappa 


0.89 


0,79 


~ OACI 


87,38 


63,41 


FI 


0.93 


0,79 




Valeur OCI classe Haie 


49,34 


37,11 


Valeur OCI classe Bosquets 


94,61 


79,61 


Valeur OCI classe ligneux 


84.88 


19,13 



tableau VII. 1 : Comparaison des performances des classifications ICM et SVM, images Spot-5 annee 2010 



Cette application confirme les resultats presentes precedemment en faveur de la methode ICM 
pour des classes a majorite agricoles. 

Les figures VII.6 a VII.8 montrent un extrait des resultats de ces classifications. 
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Chapitre VII : La classification de la Trame Verte et Bleue en milieu agricole, entre enjeux et realites. 




figure VII. 7 : Classification par methode ICM des donnees Spot (2,5m, annee 2010), rappel de legende : haies 
en violet, Feuillus en vert fonce, Prairie en vert clair, Friche en gris 




figure VII. 8 : Classification par methode SVM, rappel de legende : haies en violet, Feuillus en vert fonce, 
Prairie en vert clair, Friche en gris, Eucalyptus en bleu clair 




figure VII. 6 : Reference : BD Ortho ®, IGN 
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3 : Conclusion 



3. Conclusion 

Les recents efforts des elus a promouvoir la preservation des habitats naturels et a inscrire cet 
effort dans les pages du Grenelle de l’Environnement ont mis en avant l’importance des haies. 
De nouvelles techniques de reconnaissance, de recensement et de cartographic se developpent 
et rautomatisation de celles-ci permettront d’etre plus efficace. Les resultats presentes montrent 
des cartes indicatives, necessaires aux differents acteurs du maintien des corridors ecologiques, 
qui peuvent disparaitre du fait des activites anthropiques grandissantes. Du choix de l’image 
satellite a la validation de la classification non supervisee ou supervisee par l’utilisateur, une 
attention particuliere est requise, tant au niveau du choix des dates que lors de l’echantillonnage 
qu’il soit de verification ou d’apprentissage. 

En general, la qualite globale des resultats est satisfaisante avec une bonne moyenne de pixels 
correctement classes pour la classe Haie. Des confusions avec les bordures des bois et avec des 
Bois parsemes (proches des haies qui sont constitutes de beaucoup de feuillus et resineux) 
peuvent apparaitre, mais sont corriges par traitements de post-classification. Toutefois, pour 
obtenir une plus grande precision des resultats, le mode supervisee s’ impose. 

On peut conclure en soulignant que 1’ emplacement des haies peut etre detecte aux echelles de 
2.5 a 10m, que les dates de juin et de preference celles d’automne, et les bandes spectrales MIR 
et/ou rouge sont importantes pour detecter les haies. Une resolution inferieure a 2,5m fournit 
beaucoup de details sur les haies et la prise d’echantillons est plus difficile du fait de 
l’heterogeneite de cette classe. 

La methode de classification globale ICM est la methode ayant fournie les meilleurs resultats, 
meme pour des objets fins et heterogenes, mais le nombre d’echantillons d’apprentissage doit 
etre suffisant. 
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Conclusion generale 



Conclusion generale 

Les nouveaux et futurs satellites offriront une plus grande diversite de caracteristiques : 
spectrale, temporelle, resolution spatiale et superficie de l’emprise du satellite. Les donnees de 
teledetection sont aujourd’hui abondantes et ouvertes au grand public, ce qui ouvre de nouvelles 
problematiques quant a la maniere d’utiliser ces donnees. 

Tout au long de cette these, je vous ai presente plusieurs methodes permettant de traiter de 
maniere automatique et performante des images de teledetection dans le but d’obtenir une carte 
d’occupation des sols. Ces methodes forment un systeme qui maximise la performance de la 
classification en fonction des donnees fournies (images de teledetection et ensemble de classes 
thematiques). II produit une image classee prete a une etude thematique. 

Les problematiques introduites et l’approche proposee 

Au cours de ce manuscrit, j’ai ete en mesure de repondre aux questions posees en introduction. 

Quelles sont les meilleures images a utiliser pour une application thematique ? 

Le probleme de selection de donnees est un probleme important en teledetection lorsque le 
nombre de donnees a traiter devient trop eleve. L’approche proposee lors de cette these s’ est 
basee sur le principe des algorithmes genetiques que j’ai adapte au domaine de la teledetection. 
Le systeme de selection presente permet desormais la selection automatique du meilleur jeu de 
donnees temporelles, spectrales ainsi que du classifieur a utiliser, et maximise ainsi la 
performance de la classification. 

Comment peut-on utiliser la diversite des informations pour ameliorer les performances 
des systemes de classification ? 

La fusion de donnees fait partie des problematiques de la teledetection. L’approche proposee 
est ici differente des methodes habituellement utilisees et permet de fusionner de maniere 
originale des resultats de classifications par minimisation des confusions entre classes et done 
la maximisation des criteres de performance. 

Ces deux processus sont regroupes dans une methode generale appelee Selection- 
Classification-Fusion qui permet d’obtenir automatiquement la meilleure classification en 
fonction d’un jeu de donnees et d’un ensemble de classes. 

Quelles sont les limites intrinseques d’une application en fonction des do nn ees 
utilisees ? Peut-on se liberer de ces limites ? Si oui comment ? 

Pour une application thematique, il n’est pas raisonnable de s’abstraire d’une definition a priori 
de classes. Pour cela, j’ai presente une methode permettant la classification sans verite terrain 
de la zone a etudier, mais a l’aide de statistiques de valeurs radiometriques, obtenues a l’aide 
de reference de zones et/ou d’annees differentes, et interpolees par methode de krigeage. 
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Les resultats 



Le systeme de Selection-Classification-Fusion a ete applique a un grand nombre de jeux de 
donnees : 8 capteurs (Formosat, Spot, Landsat, Pleiades, Worldview, Terrasar, Ers et Radarsat) 
et plus de 500 images. Pour toutes ces applications, les resultats montrent que ce systeme a 
apporte une amelioration significative des performances de la classification. 

Les applications de la methode de classification sans verite terrain de la zone a etudier ont 
egalement montre des resultats satisfaisants, relativement proches de ceux obtenus avec des 
verites terrain. Ces resultats, meme indicatif, sont indispensables pour certains modeles de 
prediction. 

Ce systeme de classification a egalement ete applique pour obtenir une carte des changements 
et des rotations de cultures, dans le but d’estimer les echanges de carbone entre le sol et 
1’ atmosphere. Les applications (meme zone, capteurs differents) ont montre la robustesse du 
systeme et la Constance des resultats. 

Enfin les etudes faites sur la cartographic des objets fins tels que les haies ou les elements 
naturels ligneux ont montre l’importance de la teledetection pour des applications ecologiques 
a grande echelle et la justesse des methodes de classification utilisees. 

Les perspectives 

L’approche proposee durant cette these est un systeme de classification. Sa structure permet 
l’ajout de nouvelles methodes, de nouvelles lois de classification pour un nouveau type de 
donnees,... 

Une perspective interessante de ce travail conceme 1’ integration de la notion de logique floue. 
L’apport de cette notion dans le systeme de Selection-Classification-Fusion permettra de 
reduire les erreurs de prise de decision notamment lorsque cette decision est incertaine. 

Concemant 1’ interpolation de signatures spectrales et temporelles, il sera interessant d’ajouter 
la possibility d’inclure de nouvelles informations sur les variations interannuelles, afin de 
reduire les erreurs d’interpolation de certaines classes telles que les cultures dont les dates des 
stades phenologiques varient chaque annee. 

La grande quantite et la diversite des donnees de teledetection permettent aujourd’hui la 
validation des nouvelles methodes proposees. Les donnees Sentinel-2 ne seront reellement 
disponibles qu’a partir de 2014 et c’est a ce moment-la que ces methodes seront appliquees a 
grande echelle. 
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Annexes 



1 . Donnees utilisees pour les applications 
1.1. Recapitulatif des donnees utilisees 

Le tableau 0. 1 resume toutes les images utilisees au cours de ce manuscrit. 



Satellite 


Annee 


Nombre 
de dates 


Taille de chaque 
image (en pixels) 


Total nombre d’ images 
utilisees 


Formosat 


2006 


17 


18 millions 


68 




2007 


10 


18 millions 


40 




2008 


9 


18 millions 


36 




2009 


16 


18 millions 


64 




2010 


10 


18 millions 


40 


Spot 


1993 


2 


16 millions 


6 




1997 


1 


16 millions 


3 




2006 


3 


16 millions 


9 




2007 


6 


16 millions 


19 




2008 


6 


16 millions 


20 




2009 


5 


16 millions 


18 




2010 


10 


65 millions 


36 




2011 


11 


16 millions 


39 


Landsat 


2010 


3 


98 millions 


15 


Pleiades 


2012 


2 


1,6 milliards 


8 


Worldview 


2010 


1 (stereo) 


100 millions 


8 












Terrasar 


2009 


5 


20 millions 


5 


ERS 


1993 


6 


16 millions 


18 


Radarsat 


1997 


4 


16 millions 


4 



tableau 0.1 : Recapitulatif des donnees utilisees lors des applications de ce manuscrit 
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1 .2. Recapitulatif des caracteristiques des satellites utilises 



Les caracteristiques des satellites dont les images ont ete utilisees lors des applications sont 
resumees aux tableaux suivants (tableau 0.2 et tableau 0.3). 



Nom satellite 


Landsat 5 


Landsat 7 


Spot 2 


Spot 4 


Spot 5 


Famille 


Landsat 


Landsat 


Spot 


Spot 


Spot 


Nationality 


USA 


USA 


France 


France 


France 


Debut 

mission 


1984 


1999 


1990 


1998 


2002 


Fin mission 


2013 




2009 


2013 




statut 


degrade 


actif 


acheve 


spot4 take 5 


actif 


Masse 


1961 


2200 


3000 




MSS et 


ETM+ : 
radiometre 




HRVIR, 


HRG, 


Instruments 


TM : 


HRY 


Pastel, 


Vegetation-2, 




radiometre 




Vegetation- 1 


HRS 


Bandes 


0,45-0,52 


0,45-0,52 








Longueur 


0,52-0,6 


0,53-0,61 


0,50-0,59 


0,50-0,59 


0,50-0,59 


d’ondes 


0,63-0,69 


0,63-0,69 


0,61-0,68 


0,61-0,68 


0,61-0,68 


(pm) 


0,76-0,9 


0,78-0,9 


0,78-0,89 


0,78-0,89 


0,78-0,89 




1,55-1,75 


1,55-1,75 




1,58-1,75 


1,58-1,75 




2,08-2,35 


2,09-2,35 








Resolution 

(m) 


30 


30 


20 


20 


10 (20 MIR) 


IR 


10,4-12,5 


10,4-12,5 








Resolution 

(m) 


120 


100 








Pan 




0,52-0,9 


0,50-0,73 


0,61-0,68 


0,48-0,71 


Resolution 

(m) 




15 


10 


10 


5 


Super Pan 

Resolution 

(m) 




0,48-0,71 

2,5 


Altitude (km) 


705 


705 


832 


832 


832 


Cycle (jours) 


16 


16 


26 


26 


26 


Heure 


9h30-10h 


10h-10hl5 








Emprise 
(km x km) 


180x172 


180x172 


60x60 


60x60 


60x60 



tableau 0.2 : Caracteristiques des families de satellites Landsat et Spot 
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Nom satellite 


Formosat-2 


Sentinel-2 


Pleiades- 

lab 


Worldview-2 


Terrasar-X 


Famille 




Sentinel 


Pleiades 






Nationality 


Taiwan 


Europe 


France 


USA 


Allemagne 


Debut 
mission 
fin mission 


2004 




2011 


2009 


2007 


statut 


actif 


prevu 


actif 


actif 


actif 


Masse 


764 


1200 


980 


2800 


1230 


Bandes (pm) 


0,45-0,52 


0,433-0,453** 


0,43-0,55 


0,4-0,45 






0,52-0,60 


0,4575-0,5225 


0,49-0,61 


0,45-0,51 






0,63-0,69 


0,5425-0,5775 


0,6-0,72 


0,51-0,58 






0,76-0,90 


0,65-0,68 


0,75-0,95 


0,585-0,625 








0,6975-0,7125* 




0,63-0,69 








0,7325-0,7475* 




0,705-0,745 








0,773-0,793* 




0,77-0,895 








0,7845-0,8995 

0,855-0,875* 

0,935-0,955** 

1,360-1,39** 

1,565-1,655* 

2,1-2,28* 




0,86-1,04 




Resolution 

(m) 


8 


10/20*/ 60** 


2,8 


1,85 


1 (3/18) 


Pan 


0,45-0,90 




0,48-0,83 


0,45-0,8 




Resolution 

(m) 


2 




0,7 


0,46 




Altitude (km) 




786 


694 


770 


514 


Cycle (jours) 


5 


5 


26 


u 


11 


Heure 








10h30 




Emprise 
(km x km) 


24x24 


290x290 


20x20 


96x110 

48x110 

stereo 


10x5/ 
30x50 / 
100x150 



tableau 0.3 : Caracteristiques des satellites Formosat-2, Sentinel-2, Pleiades, Worldview-2 et Terrasar-X 
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1.3. Les donnees Formosat-2 



La figure 0.1 illustre les histogrammes des dates utilisees pour les applications Formosat-2 des 
annees 2006 a 2010. 




■ 2006 

■ 2007 

■ 2008 

■ 2009 

■ 2010 



figure 0.1 : Histogramme des images Formosat-2 utilisees 



Les images des resultats finaux de classification sont presentes (figure 0.2 a figure 0.6). 

Le tableau 0.4 foumit les classes thematiques pour chaque annee ainsi que la superficie des 
verites terrain consideree pour l’apprentissage et pour la validation. 

Le tableau 0.5 et le tableau 0.6 fournissent les performances de chaque resultat final de 
classification par annee (resultat du systeme de Selection-Classification-Fusion). 

Les tableaux (0.7 a 0.9) fournissent respectivement la matrice de confusion classique, la matrice 
de confusion avec ponderation de probabilites de la methode Maximum de Vraisemblance et la 
matrice de similitude. 
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figure 0.3 : Classification finale annee 2007 



figure 0.2 : Classification finale annee 2006 




figure 0.4 : Classification finale annee 2008 



figure 0.5 : Classification finale annee 2009 




figure 0.6 : Classification finale annee 2010 



_J Non classe [ ] ble tendre 


| sorgho 


_J prairie temporaire 


_J gravieres 


batti diffus 


| feuillus 


| colza 


| soja 


| eau libre 


peu pliers 


| surface minerale 


| resineux [^] orge 


| pois 


| lac 


eucalyptus 2 


| mais ensilage 


eucalyptus mais 


jachere_surface gel 


| bati dense 


chanvre 


| mais non irrigue 


^ ble dur 


| tournesol 


| friche 


bati ind_surf minerale pre_prairie permanente 
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Surface des 
classes (Ha) 


2006 


2007 


2008 


2009 


2010 


Appr. 


Valid. 


Appr. 


Valid. 


Appr. 


Valid. 


Appr. 


Valid. 


Appr. 


Valid. 


Bati dense 


3,90 


3,90 


3,55 


3,55 


0,90 


0,89 


0,90 


0,89 


1,25 


1,25 


Bati diffus 


3,36 


3,36 


2,75 


2,75 


1,77 


1,77 


1,77 


1,77 






Bati ind./surf min. 


2,22 


2,21 


1,58 


1,58 


0,89 


0,89 


0,89 


0,89 


6,98 


6,98 


Ble dur 


961,97 


961,97 


212,27 


212,27 


461,34 


461,34 


206,13 


206,13 


128,49 


128,49 


Ble tendre 










542,06 


542,05 


463,16 


463,16 






Chanvre 














42,46 


42,46 


6,85 


6,85 


Colza 


176,04 


176,04 


88,73 


88,72 


295,56 


295,56 


291,94 


291,94 


39,44 


39,44 


Eau libre 


30,57 


30,57 


18,58 


18,57 


29,18 


29,17 


21,89 


21,89 


7,58 


7,58 


Eucalyptus 


15,27 


15,26 


26,28 


26,27 


27,16 


27,16 


20,23 


20,23 


2,07 


2,07 


Eucalyptus 2 














17,79 


17,79 






Feuillus 


108,13 


108,13 


94,59 


94,59 


108,37 


108,37 


107,96 


107,96 


14,98 


14,98 


Friche 


5,83 


5,83 


3,53 


3,52 


4,21 


4,21 


32,02 


32,01 


47,42 


47,41 


Gravieres 


66,41 


66,41 


46,99 


46,98 


41,39 


41,38 


41,39 


41,38 


2,11 


2,10 


Jacheres 


541,41 


541,41 


51,89 


51,89 


242,13 


242,12 


278,69 


278,69 


13,07 


13,07 


Lac 


43,71 


43,71 


45,89 


45,89 


31,99 


31,99 


32,30 


32,29 


0,23 


0,23 


Mais 


237,20 


237,20 


187,58 


187,58 


542,11 


542,11 


518,65 


518,65 


78,36 


78,35 


Mais ensilage 


61,25 


61,24 






53,48 


53,48 


29,15 


29,15 


8,81 


8,81 


Mais non irrigue 










13,91 


13,90 


5,27 


5,26 






Orge 


147,09 


147,09 


6,22 


6,22 


204,34 


204,33 


214,75 


214,74 


5,34 


5,34 


Peupliers 


15,21 


15,21 


13,20 


13,20 


15,21 


15,21 


23,11 


23,10 






Pois 


45,82 


45,82 


2,27 


2,27 






33,18 


33,18 






Prairie perm. 


267,58 


267,57 










261,75 


261,74 






Prairie temp. 


215,73 


215,73 


137,06 


137,06 


306,13 


306,13 


401,43 


401,43 


0,42 


0,41 


Resineux 


41,22 


41,22 


32,66 


32,66 


42,11 


42,11 


20,81 


20,81 


1,22 


1,22 


Soja 


56,97 


56,97 


2,43 


2,43 


88,60 


88,60 


136,76 


136,76 


7,42 


7,42 


Sorgho 


72,73 


72,73 


6,55 


6,55 


59,32 


59,32 


91,57 


91,57 


2,44 


2,43 


Surface min. 


1,46 


1,45 






1,75 


1,75 


1,75 


1,75 






Tournesol 


476,84 


476,84 


18,78 


18,77 


573,88 


573,88 


796,26 


796,26 


28,01 


28,01 



tableau 0.4 : Classes utilisees pour les differentes annees avec la superficie des verites terrain associees en Ha 
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2006 


2007 


2008 




2009 


2010 


AA 




94,02 


90,43 


91,71 




94,4 


96,01 


AP 




87,04 


84,29 


85,58 




91,48 


96,08 


OA 




92,23 


92,82 


88,46 




92,36 


97,06 


Kappa 




0,91 


0,92 


0,87 




0,92 


0,96 


AOCI 




82,53 


78,12 


78,58 




86,52 


92,19 


FI 




0,9 


0,87 


0,89 




0,93 


0,96 


tableau 0.5 


Performances globales des resultats finaux des differentes annees 




Yaleur OCI 
pour la classe : 


2006 


2007 


2008 


2009 


2010 


Bati dense 






54,74 


51,04 


85,27 


86,33 




Bati diffus 






49,43 


58,68 


25,96 


43,77 




Bati industriel/surf minerale 


52,14 


91,30 


82,07 


92,09 


76,77 


Ble dur 






94,40 


88,83 


64,20 


84,27 


96,69 


Ble tendre 










60,81 


82,97 




Chanvre 












97,13 




Colza 






95,25 


93,95 


95,05 


95,91 


98,73 


Eau libre 






98,03 


95,11 


92,67 


97,82 


100,00 


Eucalyptus 






92,67 


94,28 


72,62 


96,34 


100,00 


Eucalyptus 2 












97,20 




Feuillus 






95,61 


96,69 


95,80 


95,97 


99,96 


Friche 






8,42 


33,85 


13,51 


56,97 




Gravieres 






99,55 


98,15 


99,64 


99,54 


100,00 


Jacheres 






69,24 


57,48 


58,63 


63,25 


66,85 


Lac 






99,34 


98,41 


99,76 


99,90 


100,00 


Mais 






97,99 


97,53 


96,88 


98,25 


99,67 


Mais ensilage 






98,65 




96,58 


93,92 


99,71 


Mais non irrigue 








80,91 


92,63 




Orge 






83,77 


92,74 


78,56 


83,27 


87,85 


Peupliers 






98,15 


97,48 


97,26 


96,15 


100,00 


Pois 






97,55 


98,03 




94,25 




Prairie permanente 




66,66 






54,87 


99,81 


Prairie temporaire 




63,31 


71,29 


59,00 


65,80 


80,37 


Resineux 






97,58 


97,26 


83,96 


97,32 


100,00 


Soja 






94,11 


96,05 


97,43 


97,92 


99,83 


Sorgho 






95,74 


97,85 


64,69 


82,51 


98,95 


Surface minerale 




83,77 




88,82 


82,82 


44,44 


Toumesol 






94,57 


79,24 


95,91 


93,24 


94,14 



tableau 0.6 : Performances par classe des resultats finaux des differentes annees 
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tableau 0.7 : Matrice de confusion en effectif de la classification des donnees Formosat-2 annee 2009 par la methode ICM 





bati dense 


bati/surf 

minerale 


bati diffus 


ble dur 


ble tendre 


chanvre 


colza 


eau libre 


eucalyptus 


eucalyptus 

2 


feuillus 


friche 


gravieres 


jachere/gel 


p 4 

o 


mais 


mais 

ensilage 


mais non 
irrigue 


orge 


peupliers 


pois 


prairie 

temporaire 


pre/prairie 

permanent 


resineux 


soja 


sorgho 


surface 

minerale 


tournesol 


Somme 

verification 


bati dense 


139 
























































139 


bati/surf min 




139 






















































139 


bati diffus 


3 




25 




















































28 


ble dur 






6 


3123 


412 




65 










9 




145 










111 






15 








86 


31 


9 


4012 


ble tendre 






14 


1419 


19129 




541 










39 




723 










1159 






11 








41 




25 


23101 


chanvre 












4418 












1 




28 




1 




















37 




27 


4512 


colza 






32 


34 


22 




243 










15 




776 










43 






4 








16 




2 


1187 


eau libre 






4 










3323 












2 




2 






















2 


12 


3345 


eucalyptus 


















378 


2 


5 


42 




2 












4 








25 










458 


eucalyptus 2 




















2738 


2 


23 




11 






























2774 


feuillus 






3 












15 




16395 


342 




1 












79 




1 




2 








1 


16839 


friche 






34 


2 






3 




24 




66 


4813 




21 












11 




4 


1 






7 




13 


4999 


gravieres 






18 




















6448 
































6466 


jachere/gel 






117 


186 


6 


42 


198 




63 


141 


12 


6787 




2256 




15 






72 


93 




948 


168 






687 


15 


219 


12025 


lac 














3 
















542 




























545 


mais 




























13 




6589 


242 


6 














26 


1743 




181 


8800 


mais ensilage 






1 


























1 


454 


















4 




4 


464 


mais non irri 
































12 




426 
















13 




2 


453 


orge 






19 


2149 


212 




24 










39 




562 










12611 






6 


1 






111 




78 


139 


peupliers 






















17 


2 




8 












3557 




1 








3 




1 


3589 


pois 






1 


61 






2 




1 






26 




85 










18 




626 


2 








127 




3 


952 


prairie temp 






152 


39 






415 




12 


79 


137 


2646 




525 










183 


12 




19654 


49 






99 


6 


265 


24273 


prairie perm 


21 


7 


378 


3 






29 




4 


11 


5 


186 




2996 










4 


11 




2754 


5852 






28 


63 


16 


12368 


resineux 






8 












15 




41 


14 




8 




1 
















316 










403 


soja 




























4 




76 


















877 


552 




97 


1606 


sorgho 






4 


96 


78 












1 


14 




19 




61 




1 








1 






1 


13843 




85 


14204 


surface min 






















































272 




272 


tournesol 






64 


155 


12 


122 


25 






6 




38 




723 




6 


96 








6 


19 






6 


621 


58 


5767 


64613 


Somme classif 


163 


146 


880 


7267 


19871 


4582 


1548 


3323 


512 


2977 


16681 


15036 


6448 


8908 


542 


6764 


792 


433 


14201 


3767 


632 


23420 


6071 


343 


910 


18018 


447 


6807 


171489 
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tableau 0.8 : Matrice de confusion avec ponderation de probability de la classification des donnees Formosat-2 annee 2009 par la methode ICM 





bati dense 


bati/surf 

minerale 


P> 

Q* 

i 

C/3 


ble dur 


ble tendre 


chanvre 


colza 


eau libre 


eucalyptus 


eucalyptus 

2 


feuillus 


friche 


gravieres 


jachere/gel 


E7 

o 


mais 


mais 

ensilage 


mais non 
irrigue 


orge 


peupliers 


pois 


prairie 

temporaire 


pre/prairie 

permanent 


resineux 


soja 


sorgho 


surface 

minerale 


tournesol 


Somme 

verification 


bati dense 


4,0 
























































4,0 


bati/surf min 




2,0 






















































2,0 


bati diffus 


0,1 




5,8 




















































5,9 


ble dur 








1214 


15,6 




1,5 










0,4 




4,8 










3,5 






0,5 








2,1 


0,6 


0,2 


1243,2 


ble tendre 






0,4 


558,2 


756 




12,6 










1,5 




25,2 










37,9 






2,8 








8,8 




0,4 


1403,8 


chanvre 












187,1 












0,0 




0,9 
























1,0 




0,6 


189,6 


colza 






0,4 


10,3 


0,7 




825,7 










0,4 




27,0 










1,4 






1,3 








2,5 




0,3 


870,0 


eau libre 






0,1 










242,0 








































0,1 


242,2 


eucalyptus 


















198,7 


0,1 


0,2 


1,6 




0,1 












0,2 








1,7 










202,6 


eucalyptus 2 




















166,1 


0,1 


0,8 




0,4 






























167,4 


feuitfris 






0,1 












0,6 




1124,5 


14,0 




0,4 












3,5 








1,0 










1144,1 


friofee 






0,7 








0,1 




1,3 




3,3 


216,7 




0,8 












0,5 




0,1 


0,0 






0,2 




0,2 


223,8 


grayi^res 






0,1 




















612,2 
































612,4 


jachjre/gel 






2,7 


4,3 


0,2 


0,5 


5,1 




3,4 


7,3 


0,5 


326,2 




837,0 




0,5 






2,0 


4,8 




36,2 


8,1 






19,3 


0,5 


4,8 


1263,5 


lac 






























398,8 




























398,8 


mais=- 
































2783,3 


5,6 


0,2 














0,5 


47,2 




3,7 


2840,4 


mafsjnsilage 
































0,0 


185,3 


















0,1 




0,1 


185,5 


maTsnon irri 
































0,4 




19 
















0,3 




0,1 


19,8 


orge~ 






0,6 


61,9 


7,3 




6,0 










13,5 




22,9 










470,9 






2,1 


0,0 






2,7 




1,4 


589,4 


peuphers 






















0,7 


0,7 




0,3 












220,0 




0,0 








0,1 




0,0 


221,8 


poi£2 






0,0 


1,4 






0,6 










1,2 




3,9 










0,2 




31,2 










3,6 




0,8 


43,0 


prairie temp 






3,4 


10,7 






11,2 




0,5 


4,6 


6,6 


110,6 




220,4 










5,8 


0,8 




781,6 


19,6 






24,8 


0,3 


5,7 


1206,5 


prairie perm 




0,1 


8,1 


1,0 


0,0 




0,5 




0,3 




2,0 


68,4 




104,4 










0,1 


0,7 




100,8 


278,3 






0,5 


1,4 


0,4 


567,1 


resineux 






0,2 












0,8 




2,1 


0,4 




0,2 




0,0 
















232,3 










236,2 


soja 




























0,1 




2,8 


















340,7 


13,7 




2,1 


359,5 


sorgho 








4,4 


3,0 












0,0 


0,3 




0,6 




2,2 




0,1 








0,0 






0,0 


498,6 




2,4 


511,6 


surface min 






















































9,5 




9,5 


tournesol 






1,1 


6,1 


0,4 


3,2 


0,6 










1,2 




25,6 






1,7 










0,5 






0,2 


185,6 


1,4 


1691,9 


1919,5 


Somme clas. 


4,1 


2,1 


23,7 


1872,2 


783,3 


190,8 


863,9 


242,0 


205,6 


178,0 


1140,1 


758,1 


612,2 


1275,1 


398,8 


2789,2 


192,6 


19,2 


521,7 


230,5 


31,2 


926,1 


306,1 


235,1 


341,4 


810,8 


13,7 


1715,1 


16682,8 
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o 

cr 



OQ 



3. 

crq 



o 

CfQ 



I 

o 



"T3 

§. 






bati dense 

bati/ surf min 

bati diffus 

ble dur 

ble tendre 

chanvre 

colza 

eau libre 

eucalyptus 

eucalyptus 2 

feuillus 

friche 

gravieres 

jachere/gel 

lac 

mais 

mais ensilage 
mais non irri 
orge 

peupliers 

pois 

prairie temp 

prairie perm 

resineux 

soja 

sorgho 

surface min 

tournesol 



100,0 



0,0 



100,0 



0,0 



100,0 





40,3 


50,7 










0,4 








0,1 


8,6 


















32,9 


62,5 










0,6 








0,1 


4,0 






















51,0 












12,2 


0,1 


0,2 






0,6 






12,6 


11,5 


11,7 




0,3 


0,4 


98,5 


100,0 
















0,6 






0,1 


















99,4 


94,6 
















5,3 
























99,7 0,3 








































99,0 


100,0 














1,0 














0,3 


1,4 


4,6 










84,1 


100,0 






5,3 


1,4 






1,8 


0,4 


0,5 




0,2 


0,2 






8,2 












78,6 


2,5 


0,4 












6,5 


0,5 


3,3 








4,5 








0,1 




39,0 


13,0 


7,6 






0,2 






1,8 


2,6 


31,1 
















2,0 






0,3 


97,3 












0,4 








13,9 


25,5 










0,5 








0,4 


59,2 










0,3 




0,1 












15,2 




1,8 








0,2 




82,1 




0,3 


0,4 














4,2 








0,1 




0,1 








0,1 


27,6 


50,1 


49,6 


4,0 


30,3 


33,9 










0,0 




0,0 




0,0 










28,1 




8,0 


63,9 


100,0 












0,5 








0,7 






1,4 


11,4 


0,2 




0,4 






61,4 


1,8 


22,2 


0,3 






5,3 








0,1 




0,4 


0,8 


3,1 






0,5 






35,2 


25,0 


29,5 








































100,0 


0,3 






2,6 












0,3 


1,0 


0,2 






2,2 






27,2 


10,9 


55,4 



tableau 0.9 : Matrice de similitude de la classification des donnees Formosat-2 annee 2009 par la methode ICM 
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1.4. Les donnees Spot- 2/4/5 



La figure 0.7 illustre les histogrammes des dates utilisees pour les applications Formosat-2 des 
annees 2006 a 2010. 



12 




■ 2006 

■ 2007 

■ 2008 

■ 2009 

■ 2010 
■ 2011 



figure 0.7 : Histogramme des images Spot utilisee 



Les resultats finaux sont presentes (figure 0.8 a figure 0.13) 

Le tableau 0.10 fournit les classes thematiques pour chaque annee ainsi que la superficie des 
verites terrain consideree pour l’apprentissage et pour la validation. 

Les 0. 1 1 et 0. 1 2 fournissent les performances de chaque resultat final de classification par annee 
(resultat du systeme de Selection-Classification-Fusion). 
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Superficie des 
classes (Ha) 


2006 


2007 


2008 


2009 


2010 


2011 


Appr. 


Valid. 


Appr. 


Valid. 


Appr. 


Valid. 


Appr. 


Valid. 


Appr. 


Valid. 


Appr. 


Valid. 


autres gels 






2,32 


2,28 










205,87 


205,87 






bati dense 


4,60 


4,56 


2,48 


2,44 


18,68 


18,68 


0,76 


0,72 


3,36 


3,36 


18,68 


18,68 


bati diffus 


9,36 


9,32 


7,96 


7,92 


19,64 


19,60 


0,88 


0,84 


1,58 


1,57 


19,64 


19,60 


bati industriel 


6,40 


6,36 


20,60 


20,60 


32,48 


32,44 


10,32 


10,32 


2,52 


2,52 


25,64 


25,64 


ble dur 


1688,24 


1688,20 


521,36 


521,32 


1354,64 


1354,60 


78,80 


78,76 


766,52 


766,52 


488,00 


488,00 


ble tendre 






735,68 


735,64 


1116,48 


1116,48 






1291,06 


1291,06 






chanvre 


















3,93 


3,92 


7,72 


7,72 


colza 


188,76 


188,76 


228,92 


228,92 


433,60 


433,56 


68,80 


68,80 


322,21 


322,21 


143,64 


143,60 


eau libre 


74,24 


74,20 


36,40 


36,40 


82,60 


82,60 


61,56 


61,52 


38,07 


38,06 


39,96 


39,96 


eucalyptus 


28,28 


28,24 


27,24 


27,24 


27,32 


27,28 


22,48 


22,44 


11,56 


11,56 


23,76 


23,72 


feuillus 


449,96 


449,92 


130,36 


130,32 


164,12 


164,12 


98,12 


98,08 


122,01 


122,00 


194,92 


194,88 


friche 


5,80 


5,80 


6,76 


6,72 






5,76 


5,72 


1,40 


1,40 






graviere 


40,28 


40,24 


86,88 


86,84 


50,36 


50,36 


41,12 


41,08 


25,21 


25,20 


62,96 


62,92 


graviere ancienne 


















2,41 


2,41 






jachere/surf. gel 


79,00 


78,96 


98,08 


98,04 


16,28 


16,24 


27,60 


27,60 










lac 


86,60 


86,56 


65,68 


65,64 


44,56 


44,52 


80,32 


80,28 


48,89 


48,89 


44,56 


44,52 


mais 


578,68 


578,68 


127,44 


127,40 


722,04 


722,04 


87,32 


87,32 


466,90 


466,90 


368,12 


368,12 


orge 


160,08 


160,08 


146,16 


146,16 


263,80 


263,76 


2,36 


2,32 


211,83 


211,82 


50,80 


50,80 


peuplier 


15,16 


15,16 


15,20 


15,20 


15,20 


15,20 


18,08 


18,04 


14,62 


14,61 


32,48 


32,44 


pois 






27,48 


27,48 


52,12 


52,08 


4,04 


4,00 






24,28 


24,28 


prairie perm. 


77,20 


77,20 


58,56 


58,52 


24,84 


24,80 


13,92 


13,92 


401,56 


401,55 


136,32 


136,32 


prairie temp. 


138,68 


138,64 


86,72 


86,68 


17,12 


17,08 


16,80 


16,76 


48,52 


48,52 


259,40 


259,36 


prairie temp. 2 






207,32 


207,32 






48,44 


48,40 










resineux 


92,52 


92,48 


74,32 


74,32 


84,72 


84,68 


43,00 


43,00 


42,21 


42,20 


41,72 


41,72 


soja 


30,00 


29,96 


40,68 


40,64 


88,24 


88,20 


9,08 


9,08 


20,82 


20,82 


34,40 


34,36 


sorgho 


34,72 


34,72 


12,72 


12,68 


102,24 


102,20 


2,60 


2,60 


46,54 


46,54 






surface minerale 


14,28 


14,28 


25,84 


25,84 


1,72 


1,68 


1,32 


1,32 


0,87 


0,86 


1,72 


1,68 


tournesol 


670,60 


670,56 


86,04 


86,00 


1618,80 


1618,80 


52,08 


52,08 


684,18 


684,18 


569,24 


569,24 



tableau 0.10 : Classes utilisees pour les differentes annees avec la superficie des verites terrain associees (en Ha) 
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Indices 
(en % sauf 
Kappa et FI) 


2006 


2007 


2008 


2009 


2010 


2011 


AA 


81,67 


89,17 


89,90 


82,90 


95,46 


92,47 


AP 


69,78 


84,24 


84,03 


83,55 


91,96 


92,95 


OA 


92,26 


87,32 


88,68 


88,22 


89,52 


93,47 


Kappa 


0,90 


0,85 


0,87 


0,87 


0,88 


0,93 


AOCI 


61,93 


76,02 


75,57 


69,77 


88,00 


86,07 


FI 


0,75 


0,87 


0,87 


0,83 


0,94 


0,93 



tableau 0.11 : Performances globales des resultats finaux des differentes annees 



Yaleur OCI 
pour la classe : 


2006 


2007 


2008 


2009 


2010 


2011 


Bati dense 


12,14 


43,16 


72,65 


22,22 


96,53 


69,75 


Bati diffus 


57,18 


67,15 


51,40 


22,32 


53,40 


60,63 


Bati industriel 


22,24 


30,25 


92,15 


90,08 


99,21 


95,82 


Ble dur 


95,53 


64,82 


73,98 


85,41 


67,47 


94,47 


Ble tendre 




75,20 


65,23 




72,52 




Chanvre 










95,92 


98,96 


Colza 


97,40 


91,68 


84,98 


74,63 


97,41 


97,64 


Eau libre 


95,91 


90,61 


87,90 


86,01 


99,24 


92,41 


Eucalyptus 


77,81 


83,68 


82,35 


85,09 


100,00 


88,17 


Feuillus 


94,51 


92,08 


89,60 


90,27 


99,49 


93,07 


Friche 


5,24 


29,62 




50,62 


86,66 




Graviere 

ancienne 










98,34 




Gravieres 


94,63 


90,89 


92,69 


89,47 


98,65 


92,95 


Jachere 


41,07 


89,47 


77,90 


48,34 


72,00 




Lac 


95,94 


95,80 


96,14 


95,27 


98,28 


93,71 


Mais 


90,62 


86,91 


87,76 


93,86 


92,93 


95,80 


Orge 


60,95 


62,56 


68,17 


43,10 


67,05 


84,19 


Peupliers 


86,06 


92,13 


89,77 


69,52 


96,51 


90,63 


Pois 




71,06 


48,93 


65,19 




89,55 


Prairie 

permanente 


42,03 


56,56 


86,84 


20,47 


84,59 


56,33 


Prairie temp. 


52,31 


59,93 


39,39 


69,23 


53,17 


59,12 


Prairie temp. 2 








53,06 






Resineux 


87,99 


93,45 


91,22 


87,48 


98,32 


95,24 


Soja 


34,46 


95,87 


65,36 


96,57 


98,70 


94,76 


Sorgho 


26,73 


77,62 


37,40 


89,80 


86,35 




Surface 

minerale 


0,00 


96,79 


61,22 


56,57 


91,92 


69,05 


Toumesol 


91,80 


87,16 


95,04 


90,01 


95,25 


95,18 



tableau 0.12 : Performances par classe des resultats finaux des differentes annees 
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figure 0.10 : Classification finale annee 2008 




figure 0.12 : Classification finale annee 2010 

| F eu ill le | | Els Mai's- Scja 

I z 'se ins jx C:lza TDinascI JadiEra'gal 

\ Eucalyptus | | Grge Scrghc | | Fricha 



figure 0.1 1 : Classification finale annee 2009 




figure 0.13 : Classification finale annee 2011 



| PrarE tampcraira Bati danse 

| Eau ibre | | Bati ind./surf min. 

| Lac | | Gravraes 



Fa up liars 

Pra/prarie permanenta 
Bali d rffu 
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1.5. Les donnees Landsat-5/7 




20090629 

ORTHO SURF CORR PENTE 



20090701 

ORTHO _SUkF_CORR_PENTE 



Tuile 05-63 



Tuile 06-63 



Tuile 03-63 



Classe thematique 



Classes utilisees 



Feuillus 



Feuillus, Eucalyptus, Peupliers, Chene, Chataigner, Robinier 



Resineux 



Resineux, Pin Sylvestre, Pin maritime, Pin Douglas, Meleze, 
Sapin pectine, Pin noir 



Mixte bois 



Mixte feuillus/resineux, Foret ouverte 



Vegetation naturelle 



Pelouse brune, Pelouse chlorophyllienne, Mixte pelouse (4), 
Landes a fougeres, Landes buissonnante, Landes mixte, Landes 
et arbres disperses, Landes et pelouse, Lande et roche, Friche 
montagne, Friche buissonnante, Garrigue parsemee, Garigue 
dense 



Cultures 



Ble dur, Ble tendre, Colza, Orge, Mais, Tournesol, Vigne, 
Jacheres 



Surfaces herbees 



Friche, Prairie temporaire, Prairie permanente, Bocages 



Eau 



Eau libre, Lac, Ocean, Gravieres 



Surface minerale 



Bati dense, Bati diffu, Surface minerale, Sable, Roche nue, 
Calcaire nu, Gres rouge 



Divers 



Ombre, Neige 



Tuile 03-62 



L’emprise des images Landsat utilisees est resumee a la figure 0.14 



Tuile 04-62 



Tuile 05-62 



Tuile 06-62 



figure 0.14 : Emprise des donnees Landsat utilisees 

La figure 0.15 presente le resultat final de 1’ occupation du sol des Pyrenees. Un regroupement 
de classes a ete effectue afin de pouvoir visualiser facilement les differentes classes thematiques 
etudiees. 

La liste des classes est presentee ci-dessous : 
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Les Pyrenees 
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Culture 


Pelouse chlorophylienne 


| Lande buissonante 


[] Arbres isol6s_Roche 


| Bati dense 





Resineux 
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Vigne 




Pelouse brune 




Lande a fougeres 




Arbres_pelouse/roche 




Bati industriel/Surf minerale 




Mixte feuillus/resineux 




Bocage 




Pelouse/ roche 


^B 


Lande arbres isoles 




Neige/Glace 




Surface minerale 




Hetre/Feuillus 

Friche arbustive/foret ouverte 




Garrigue 

Prairie 




Pelouse chlorophylienne/Roche 
Pelouse arbres isotes 




Lande buissonante/roche 
Lande/pelouse roche 




Eau 
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Bati diffus 
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figure 0.15 : Occupation du sol des Pyrenees a partir d’images Landsat 5 et 7 
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1.6. Les donnees Pleiades- 1 



Des classifications supervisees ont pour la premiere fois ete realisees sur la zone Sud-Ouest a 
partir d’images Pleiades de resolution 70cm. Seulement deux dates sont disponibles : une image 
du 23/03/2012 (figure 0.16) et une autre du 09/1 1/2012 (figure 0.17). Les classifications ont ete 
effectuees sur la zone commune aux deux images. Cette zone commune a pour taille 32786 
lignes sur 14802 colonnes soit une superficie de 23780 hectares. 



figure 0.16 : Composition coloree (fausses couleurs) 
de la zone commune : date de Mars 2012 



figure 0.17 : Composition coloree (fausses couleurs) 
de la zone commune : date de Novembre 2012 
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2. Applications et collaborations 

2.1. Apport de la teledetection en geologie 

Conclusion des auteurs de ce travail realise en partenariat avec le Cesbio, auteurs Mme 
Hammad Nabila et Mme Boussada Nawel. 

L’ evolution de la geologie a largement beneficie des techniques de teledetection et de traitement 
d’image. L’etendue des terrains d’etude, les conditions climatiques tres rudes, et l’acces limite 
aux affleurements (reliefs escarpes, masques par des recouvrements) et les durees de missions 
limitees, sont des problemes courants lors des travaux de recherches et rendent souvent 
1’ information geologique et structural inaccessible, heterogene et discontinue. 

Pour pallier a ces problemes, 1 ’utilisation de donnees de teledetection aerienne et spatiale peut 
constituer une source d’information tres appreciable qui apporte aux geologues, de toutes 
specialties confondues, une information nouvelle et differente, qui elargit Tangle de vue 
autrefois limite par ces contraintes multiples. 

En geologie, les images de teledetection montrent le terrain d’une maniere globale, ce qui 
facilite T identification de grandes structures (failles, limites lithologiques). 

De ce fait, elle permet d’enrichir la cartography geologique et notamment de detecter de 
nombreux lineaments, et de caracteriser certaines lithologies. 

Cependant, Tanalyste doit toujours tenir compte des limites de cette technique, en relations avec 
les proprieties spectrales et spatiales des donnees dont il dispose, et de la nature du terrain sur 
lequel il travaille (presence de patine et recouvrement en domaine desertique ou de couvert 
vegetal en contexte tropical et humide). 

Il est a noter que, malgre T apport non negligeable de cette technique, la teledetection reste une 
source d’information qui doit etre verifiee, validee et completee par des missions de terrain. 

Le resultat de cette etude est presente en figure 0.18. 

2.2. Cartographie d’une palmeraie aux environs d’ Agadir, Maroc 

Travaux realise dans le cadre d’un partenariat avec Tuniversite Abno Zohr, Agadir. 

Le resultat de cette etude est presente en figure 0.19. 
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Classification supervisee ICM de la region de I’Oued Righ (Sud-Est algerien) a partir d'images Landsat de 1987 




Legende 
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figure 0.18 : Resultat de l’application a la geologie de la classification d’images Landsat par la methode ICM 
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Classification supervisee ICM d'une Palmeraie 
aux environs d'Agadir, Maroc a partir d'images Worldview-2 




Legende 



Non classe 




Palmiers 



Cultures 




Ombre 



Arable 




River side 



figure 0.19 : Resultat de la classification supervisee par methode ICM d’une palmeraie aux environs d’Agadir, Maroc a partir d’images Worldview-2 
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